Title: Unit V Rgression linaire simple
1Unité VRégression linéaire simple
- Exemple dune calibration
- Calcul de la pente et de lintercept, vocabulaire
- Graphiques diagnostiques
- Prédiction
26.1 Exemple Calibration dune méthode de
chromatographie gazeuse
- Procédure
- Préparation déchantillons de concentrations
connus (étalons) qui couvrent le domaine de
travail - Injecter les échantillons dans le système GC et
mesurer pour chacun la surface du pic
correspondant - Etablir la relation entre la concentration et la
surface du pic - Etablir une équation pour determiner la
concentration pour un échantillon inconnu Ã
partir de la surface du pic
3liste des données
Nuage de points
4Ajustement dune droite Principe et terminologie
(1)
Equation dune droite
Interprétation
5Ajustement dune droite Principe et terminologie
(2)
y
Modèle statistique habituel
x
6Formules de calcul de lorigine et de la pente
- Quand la moyenne des x vaut 0, a correspond à la
moyenne des y. - Lestimateur de la pente est lié au coefficient
de correlation de Pearson
7Exemple
8Terminologie Valeurs observées, valeurs prédites
et résidus
valeur prédite
résidu
yi
valeur observée
minimiser la somme des écarts carrés
minimiser la variance des résidus
9Inférence statistique de la régression
Modèle statistique
erreur aléatoire
modèle de la droite
Estimation de lampleur de lerreur écart-type
résiduel
Intevalle de confiance pour la droite
Intervalle de prédiction (intervalle de confiance
pour une observation)
10Y a-t-il une pente?
Intervalle de confiance à 95 pour pente et
origine
pente
Test Student pour la pente
statistique de test
origine
Rechercher la valeur de probabilité pour t dune
table Student avec n-2 degrés de liberté. Si la
P-valeur est petite, la pente est significative.
11Inférence statistique pour lexemple
12Graphique combiné
- Commentaires
- La droite trace plus ou moins bien les points
- Beaucoup de points à lextérieur de lintervalle
pour la droite ... cest normal! - Intervalle pour droite plus serré au milieu ...
cest normal! - Intervalle pour les points arrive en dessous de
zéro, cest illogique - Points remplissent leur intervalle pour les
hautes conc. mais pas pour les petites - Quelques doutes sur la linéarité
surface du pic
concentration
13Questions danalyse
- Est-ce quune droite est suffissante?
- Calculer la droite
- Faire des graphiques des données brutes et de la
droite - Faire des graphiques des résidus
- Regarder pour détecter du manque dajustement
(banane?) - Est-ce que linférence statistique est valable?
- Inspecter avec soin les graphiques des données et
des résidus pour détecter - observations aberrantes
- points levier
- inhomogénité de la variation
- Est-ce quune droite est nécessaire?
- Faire un test Student sur la pente et regarder la
valeur de probabilité
Manque dajustement (erreur systématique)
erreur aléatoire
x
manque dajustement
x
x
x
x
x
x
x
vérité
x
modèlé
Un bon modèle na pas de manque dajustement
14Observations aberrantes et points levier
Homogénité de la dispersion
x
x
observation aberrante
x
observation levier
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
x
15Graphiques diagnostiques pour lexemple
concentration
16- Observations dans lexemple
- banane (problème de linéarité)
- entonnoir (variance augmente avec prédiction)
- Hypothèses
- effet blanc
- effet saturation
- erreur est probablement proportionnelle
- Idée
- travailler en logarithmes
- faire le fit avec et sans les observations aux
extrèmes
17Ajustement en logarithmes
2
1
avec extrêmes
0
ln-surface
-1
-2
-3
-5
-4
-3
-2
-1
ln-concentration
18Résidus
0x4
0x2
0x0
residu
-0x2
-0x4
-0x6
-5
-4
-3
-2
-1
ln-concentration
Commentaire la première concentration était
probablement trop basse (seuil de détection), on
lélimine de la régression et réduit le domaine
dapplication
19Calculs pour régression en logarithmes
20Calcul sans valeurs basses
21Résultat en échelles logarithmiques
22Résultat en échelles originales