Title: M
1Méthodes statistiques appliquées à la cosmologie
André Tilquin (CPPM)
Luminy le 20/9/02
?m, ??,w0,w1
?2
2Méthodes statistiques appliquées à la cosmologie
- Introduction Nature du problème
- Mathématique et définition
- Probabilité et ?2
- Transport des erreurs
- Interprétation graphique et contour
- Contraintes externes
- Minimisation
- Erreurs systématiques
- Application à SNAP
- Le modèle cosmologique
- Erreur sur les paramètres cosmologiques
- Dégénérescences et contraintes externes
- Non linéarité et contour de probabilité
- Problème en suspend
3Problème général(1)
- Supposons une mesure de N Supernovae à différents
redshift - et
un modèle
Comment trouver la meilleur courbe ? On cherche
la courbe qui passe au plus près de chacun des
points Mais les points les mieux mesurés
doivent avoir plus de poids
4Problème général(2)
- Le problème ce ramène à
- Trouver les valeurs des ?k tels que ?2 soit
minimum - Déterminer les erreurs sur les ?k a partir des
erreurs sur mi
Statistique nécessaire
5Probabilité Gaussienne
- Dans toute la suite nous supposerons que les
erreurs de mesure sont Gaussiennes, i.e si lon
répète N fois la même mesure alors la
distribution des mesures suit la distribution en
probabilité - Avec valeur moyenne
- Variance ou erreur
6Cas de N variables (corrélation)
- Supposons n mesures Gaussiennes
Coefficient de corrélation.
Déterminant
Si ?0 Si ?1
V est singulière
7Maximum de vraisemblance(?0).
Quelle est la courbe la plus vraisemblable ?
Réponse La courbe la plus probable ! La
probabilité de la courbe est définie comme le
produit des probabilités de chaque point dêtre
autour de cette courbe
Il faut maximiser L par rapport au ?k ?
Comme il est plus simple de travailler avec des
sommes
?
Il faut minimiser par rapport au ?k
8Quelques propriétés du ?2
Probabilité et ?2 Par définition
Définition matricielle
Dérivée seconde
- La dérivée première du ?2 donne le minimum
- La dérivée seconde du ?2 donne linverse de la
matrice derreur indépendante des points de
mesures.
9Densité de probabilité du ?2
- Densité de probabilité du ?2Supposons que lon
mesure N fois une variable x. Pour chaque mesure
on a
Dans le cas de n degré de liberté i.e n points
de mesure
- On montre que
- La valeur moyenne du ?2 est n
- La variance est 2n
Donc, la premier test de compatibilité entre des
mesures et un modèle est de vérifier que
Attention au fait que la variance est 2n
10Niveau de confiance
- On définit le niveau de confiance (ou confidence
level) comme la probabilité que toute nouvelle
expérience donne un ?2 supérieur
10 des expériences donneront ?2gt16
- Définition de lécart standard
- Le résultat dune mesure avec
une erreur à s sigma.
n1, p68
- Pour 2 (ou plus) variables mesurées simultanément
un résultat à s écart est défini avec le ?2,
mais les probabilités dépendent du nombre de
variables.
n2, p39
n2, p68
Pour plusieurs mesures simultanées on parle
plutôt de la probabilité !!!
11Propriété du niveau de confiance
Densité de probabilité du niveau de confiance
h(?)
N mesures pour les quelles on calcule un ?2
En utilisant la loi de conservation des
probabilités
Si le modèle est correcte, et si les erreurs sont
uniquement statistiques et correctement estimées,
la densité de probabilité du niveau de confiance
doit être plate, i.e les mesures de ?k se
répartissent uniformément entre 0 et 1.
12Application au fit des courbes de lumières
Supposons que nous ayons N courbes de lumières
ajustées avec un template.
Mauvais fit Mauvaise SN Mauvais template
Bonnes courbes de lumière
Critère de sélection
Efficacité 95
Erreurs trop petites
Erreurs trop grandes
Mauvais template
13Changement de variables
Une fois le ?2 défini sur les variables mesurées
(i.e magnitude), comment trouver les erreurs sur
les paramètres physiques, ?k ?
On développe le ?2 autour du minimum
0
Si la transformation m(?k) est linéaire,
alors La dérivée seconde du ?2 est une matrice
symétrique positive Les erreurs sur ?k sont
Gaussiennes
14Changement de variables(2)
Dans le cas simple
lt?0gt si n??
Si m(?k, ?l) est linéaire
Jacobien
Lerreur sur les paramètres physiques se déduit
dune simple projection sur lespace des ?k
(approximation linéaire) nommée analyse de Fisher
Indépendant des points de mesures
15Changement de variables (exemple)
- Supposons que par la méthode précédente on ait
déterminé les erreurs sur ?m et ?? , (pas de
corrélation). On voudrait lerreur sur S?m?? et
D?m-?? - On construit la matrice de covariance
- On construit le jacobien
- On projette
- On inverse V
16Interprétation graphique (contour)
- Léquation défini une
ellipse diso-probabilité.
?
?-?/4
68
17Contraintes externes
- Problème En utilisant les SN on cherche à
mesurer (? m,??) sachant que le CMB a mesuré
?T?m??1.01?0.05. - Cette mesure étant indépendante on peut
facilement linclure dans le ?2.
Toutes les équations précédentes restent vraies
en substituant à
Ainsi que le Jacobien
18Erreur sur le paramètre z
SNAP mesure mi et zi avec des erreurs ?m et ?z.
Le redshift est utilisé comme paramètre et son
erreur nest pas dans le ?2.
Lerreur sur z conduit à une erreur sur
m(?m,??,zi)
Lerreur sur la différence mi-mth est
19Minimisation du ?2
On développe le ?2 autour de ?ko
On applique la condition de minimum en ?k
0
Equation itérative au premier ordre
Léquation au premier ordre est en générale
suffisante. Si m(?k) est linéaire, la solution
est trouvée en une itération
20Erreurs systématiques
Définition Lerreur systématique est tous ce qui
nest pas statistique!! Statistique Si on
répète n fois la mesure dune quantité Q
avec une erreur statistique ?Q, la valeur
moyenne ltQgt tend vers la valeur vraie Q0 avec
une erreur ?Q/?n. SystématiqueQuelque soit le
nombre dexpériences, ltQgt serra toujours
différente de Q0 à lerreur systématique près ?S
Traitement Si leffet systématique est
mesurable, on le corrige, par exemple en
calculant ltQ-?Qgt et une erreur ?Q2 ?Q2
??Q2 Sinon, on ajoute les matrices derreurs V
VstatVsyst et on utilise le formalisme
général.
ChallengeLes erreurs systématiques doivent être
inférieures aux erreurs statistiques, sinon
elles lemportent quelque soit n !!!!
21En résumé
- Le ?2 est proportionnel au Log du produit des
probabilités (G) - La valeur moyenne du ?2 est égale au nombre de
degré de liberté - La dérivée première du ?2 donne les paramètres
les probables - La dérivée seconde du ?2 donne linverse de la
matrice derreur - Un changement de variables sobtient en
multipliant à droite et à gauche la matrice de
covariance par le Jacobien - Les erreurs ainsi calculées sont indépendantes
des mesures - Lintégrale de la densité de probabilité du ?2
de zéro à ?2 donne la signification statistique - La densité de probabilité du niveau de confiance
est constante - Les iso-probabilités sont obtenues en résolvant
?2 ?2min s2 - Au premier ordre, minimiser le ?2 ne nécessite
que la connaissance du Jacobien
22Application à la mesure des paramètres
cosmologiques
- Le modèle cosmologique général
- Les Super Novae avec SNAP et les erreurs de
mesure - Erreurs sur ?m et ?? et les corrélations
- Mesure de w0 et inter-corrélations
- Dégénérescence et contraintes externes
- Non linéarité et minimum secondaire
- Ellipsoïde et contour
- Normalisation et expériences Gedanken
23Magnitude of SN in general Univers
m magnitude effective z redshift (0.?2.) ms
magnitude SN à zVéga (-3.6) ?mdensité de
matière (0.?1.) ?Xdensité dénergie
noire(0.?1.) w0 paramètre équation
détat(-1?0.) w1 évolution avec redshift(-1.?1.)
24SNAP et les Super Novae
Environ 2000 SN Entre z0 et 1.7 Erreur sur la
magnitude0.01 Erreur intrinsèque0.1 Erreur sur
z 0.001 Paramètres standards
25Le Kosmoshow
26SNAP et les mesures de ?m et de ??
Résultat dune analyse de Fisher aucune
contrainte externe.
Coefficient de corrélation entre mS et ??
La raison de cette corrélation est
physique Aujourdhui, à z0 univers dominé par
énergie noire
SNAP200 Sn proches
Aujourdhui,z0
?Normalisation sol/espace fondamentale
systématiques
27Mesure du paramètre détat w0
2
7
Inter-corrélations
Corrélation structurelle ?Xw0
Ces corrélations expliquent pourquoi les erreurs
sont ?7
28Evolution des erreurs avec w0 (1)
?X na plus de sens ?pw0?0
Dégénérescence pour w0-1/3
?X nest plus contraint par Hubble
Inter-corrélations ?Erreurs ?
Solution Utiliser des contraintes externes soit
sur ?T soit sur ?m!
29Evolution des erreurs avec w0 (2)
- Utilisation de contraintes externes
- Week lensing ?m0.300.05 CMB
?m?X1.000.01
30Mesure de lévolution du paramètre détat
Sans contraintes externes, SNAP ne peut pas tout
mesurer!!
Comme les erreurs vont en 1/?N il faudrait 10000
fois plus de SN
Utilisation de contraintes
?T au près
?m a 5 près
Suivant ce que lon veut mesurer on peut utiliser
lune ou lautre des contraintes.Sauf si la
physique est au bon endroit !
31Evolution de lerreur sur ?X(w0,w1)
w0?-1 w1?1
SUGRA
32Evolution des erreurs, avec contraintes
2??(? m)??(? X)?5
2??(w0)?10 8??(w1)lt50
33Non-linéarité
- Dans hypothèse ou m(?k) est linéaire en ?k alors
- Si les erreurs sont Gaussiennes sur mi elles le
seront sur les ?k - Le ?2(?k) est une forme exactement quadratique
- La matrice de covariance est symétrique et
positive -
- Analyse de Fisher ok
- Dans le cas contraire seul le premier ?12 est
rigoureusement exacte - Les seules propriétés valides sont
- Les paramètres les plus probables sont donnés
par - L erreur à s sigma est déterminée par ?12
?2min s2
34Minimum secondaire et asymétrie
Evolution de ?12- ?min2 Fit complet, flatness
au
Rem Dans ce cas particulier, si on avait trouvé
le minimum secondaire, on se serrait juste trompé
sur la valeur centrale, pas sur les bornes
35Contour de probabilité
Comme dans le cas précèdent on peut calculer le
contour Soit à partir de ?22(?k) ?min21
?Ellipsoïde Soit à partir de ?12(mth(?k))
?min21 ?Courbe rigoureuse Question Que faire
des variables que lon ne regarde pas
? C(?m,?X)??2( ?m, ?X,ms,w0,w1) ?min2( ?m,
?X,ms,w0,w1)1
- Intégration sur les variables sans intérêts par
exemple ms - Minimiser en chaque point les variables sans
intérêts
Contour moyen ou contour espérer simulations
Contour le plus probable données réelles
On peut vérifier que (2) donne (1) si les points
de mesures (mi) sont sur la courbe i.e
mim(?k,zi)
36Contours
Fisher Rigoureux
Fisher Rigoureux
39
Ms,?m,?X fit
Ms,?m,?X,w0 fit
Fisher Rigoureux
Ms,?m,?X,w0w1 fit
37Expériences Gedanken
- Vérification statistique des contours
(normalisation) Monte-Carlo - Une fois le minimum déterminé (?k0) on répète N
fois - On tire dans les erreurs et suivant une
distribution gaussienne les mi autour de m
th(?k0,zi). On fait de même pour les contraintes
externes. - On détermine le nouveau minimum par un fit et on
vérifie si le nouveau point et dans ou hors le
contour.
Ellipse(30.4?2) Contour(39.6 ?2)
38Mauvaise normalisation
P(ellipse) (49.5?1.6) P(contour)(54.7?1.6)
P(ellipse) (35.7?1.6) P(contour)(36.1?1.6)
39Investigation
Minimum secondaire
Non physique ?m?0
- Solutions
- Statistique Bayesian
- Re-normalisation des
- densités de probabilité
- dans lespace physique
- Changement de variable
-
- On fit ?m
40CONCLUSIONS(1)
- La méthode du ?2 est très puissante et permet
- De calculer et transporter facilement les erreurs
- De trouver rapidement les valeurs les plus
probables - De construire des contours de probabilité
- De tester la validité dune mesure avec un modèle
(sélection) - Dans le cas de non linéarité entre les valeurs
mesurées et les variables physiques - Les erreurs sur les variables physiques ne sont
plus Gaussienne - Il est nécessaire de vérifier avec un Monte-Carlo
les résultats - Dans le cadre de lexpérience SNAP lanalyse du
?2 a permis - Destimer les performances du projet (erreur,
contour) - De trouver les zones délicates (dégénérescence,
corrélation) - Détudier la non-linéarité du modèle physique.
Tout ce qui est dans ce cours est dans le
KosmoShow
41CONCLUSIONS(2)
- Seules, les SN dans SNAP permettrons
- De vérifier la chandelle standard SN1a
(Systématiques) - De mesurer la constante Cosmologique avec une
erreur statistique comprise entre 3 et 5, sans
hypothèses. - La nature de lénergie noire (w0) peut être
déterminé - A 10 près, dans lhypothèse dun Univers plat et
w0lt-0.4 - A mieux que 10 prés, avec une mesure de ?m au
et quelque soit w0 - La quintessence (w1) ne serra accessible que si
- LUnivers est plat et ?m est mesuré à mieux que
le - La physique nest pas au mauvais endroit.
La mesure complémentaire aux SN est la mesure de
?m avec SNAP