Title: Prsentation PowerPoint
1Statistique descriptive
I-STATISTIQUE ET VARIABILITE
Variation inter-sujet
Variation pré instrumentale
Variation intra-sujet
Variation instrumentale
(Technique de prélèvement)
(Technique de dosage)
Variation Biologique
Variation Analytique
Variation Totale
2II-LES DEUX DOMAINES DE LA STATISTIQUE
Décrire des ensembles de données
complexes en opérant des réductions de ces
données.Cest la Statistique descriptive.
1
Débusquer (chercher) dans une variabilité
constatée ce qui peut être expliqué par le
hasard seulement ou ce qui relève dune autre
explication. Cest ce quon appelle la
Statistique Analytique ou Inductive.
2
3DONNEES STATISTIQUES
Afin de décrire un ensemble de mesure ou
dobservations concernant létat ou lévolution
dun phénomène, on peut présenter les données
statistiques de plusieurs manières.
A titre dexemple
4 Un médecin, pour étudier les risques
cardio-vasculaires de ses patients, peut remplir
pour chacun deux une fiche notant un certain
nombre de caractéristiques.
1
-Nom et prénom __________________________________
_____ -Sexe (1 pour masculin et 0 pour féminin)
__________________ -Age (ans)_____________________
________________________ - Profession ___________
________________________________ -Nombre
dincidents cardiaque __________________________
-Taille (en m) __________________________________
_______ -Poids (en Kg) __________________________
______________ -Cholestérol (en
g/l) ____________________________________ -
DONNEES STATISTIQUES
52
Pour étudier la répartition des terres agricoles
dune région,on peut faire linventaire des
exploitations agricoles (Soit N leur nombre), et
noter pour chacune delle sa taille (en
hectares), la culture dominante, le nom du chef
de lexploitationetc
DONNEES STATISTIQUES
6VARIABLE ALEATOIRE
1- Nature des variables
Observables
Mesurables
Discrètes
Nominales
Ordinales
Continues
- N. denfants
- N. de bactéries
- N. de pièces
- N. dautomobiles
- N. de patients
- etc.
- Taille
- Poids
- Taux de glucose
- Diamètre dune
- Coquille etc.
- -Sexe
- Couleur
- Ville dorigine
- Culture
- etc.
- Taille vestimentaire
- Temps observé
- Intensité lumineuse
- etc.
Expression littérale
Expression numérique
7SERIE STATISTIQUE
1- Définition
Létendue de variation de X est définie par
lintervalle x1, xk.
Une série statistique est représentée par les
valeurs relatives à une variable aléatoire X
telle que X peut prendre les valeurs x1, x2,
x3. xi..xk .
8SERIE STATISTIQUE
2- Représentation graphique
Pour exploiter au mieux une série de valeurs
expérimentales,plusieurs opérations savèrent
indispensables - - Classement des valeurs par
ordre croissant ou décroissant. - Transformation
des effectifs ni en fréquence fi. ( ou encore en
fréquence cumulées croissantes ou décroissantes).
- Répartition des valeurs xi en classes Ci .
il sagit là dune répartition en intervalles
égaux ou inégaux selon les séries étudiées et
définies par leurs fréquences relatives.
9Représentation graphique
2-1.Cas des variations discontinues
Diagramme en bâtons
Les plus classiques
Diagramme circulaire
10Représentation graphique
2-2.Cas des variations continues
Histogramme des fréquences
Polygone des fréquences
Les plus classiques
Histogramme des fréquences cumulées c ou d.
11SERIE STATISTIQUE
3- Caractéristiques dune série statistique
On caractérise très souvent une série
statistique par deux types de paramètres
- Les paramètres dit de position ou dordre 1
(moyenne, mode, médiane, quartiles..etc.)
- Les paramètres de dispersion ou dordre 2 (
variance, écart-type, coefficient de variation
.etc.)
12Caractéristiques dune série statistique
3-1. Les paramètres dits de position ou dordre 1
La moyenne arithmétique
Soit X, une V.A. qui peut prendre les valeurs
x1, x2, xi.xk ,et où chacune des valeurs
élémentaire xi est représenté par un ni ou sa
fréquence fi.
- Si les données sont organisées en
classes de centre ci et de fréquences fi, on
aura
13Caractéristiques dune série statistique
3-2. Les paramètres dits de position ou dordre 1
La moyenne géométrique
Pour le calcul, on applique Log G
n1Logx1n2Logx2.nkLogxk
La moyenne harmonique
La moyenne quadratique
14Caractéristiques dune série statistique
3-3. Les paramètres dits de position ou dordre 1
Le mode ou la valeur modale est la valeur de
lobservation dont la fréquence est maximale
(c.a.d. la plus représentée). Une série peut être
unimodale, bimodale ou plurimodale.
La médiane est la valeur de lobservation
située exactement au milieu de la série rangée
par ordre croissant ou décroissant. Elle
correspond à la fréquence cumulée de N/2 ou de
50.
Les quartiles Ils divisent la série en 4
parties égales. Le premier quartile correspond à
25, le second à 50 ( se confond avec la
médiane) et le troisième à 75 des observations
pour des série rangée par ordre croissant ou
décroissant.
15Caractéristiques dune série statistique
3-4. Les paramètres dits de dispersion ou dordre
2
Ces paramètres essayent de synthétiser par une
seule valeur numérique la dispersion de toutes
les valeurs observées.
Létendue de variation Cest la différence
entre la plus grande et la plus petite valeur de
lobservation.
Lintervalle inter-quartile Cest la différence
entre le 3ème et le 1er quartile.
La variance et lécart-type Cest une
estimation de la dispersion autour de la moyenne.
Le coefficient de variation Aussi, on peut
avoir une idée de lamplitude de la variation en
comparant et .
16Caractéristiques dune série statistique
3-5. Les paramètres dits de dispersion ou dordre
2
Calcul de la variance de lécart type et du C.V
Soit X, une V.A. telle que X x1, x2, xi.xk
.
La dispersion autour de la moyenne pour toute
valeur xi est
Ces écart peuvent être positifs ou négatifs de
sorte que la somme de ces écarts est nulle par
compensation
En effet et
17 La somme de ces écarts est nulle, elle ne permet
pas destimer la dispersion autour de la moyenne.
En élevant ces écart au carré on aura
Ce terme même sil est différent de 0 il donne
la même signification pour des différences non
comparables (10-5)?d225 et (1005-1000) ?d225.
Afin de palier à ce problème chaque somme des
carrés des écarts était pondérée de leffectif
total, soit donc
18 Ce terme défini ce que lon appelle la variance
et constitue avec lécart type la meilleure
estimation de la dispersion autour de la moyenne
elle est noté
Si les valeurs sont répétés, cette équation
revient à
19 Lécart type est défini par la racine carré de
la variance, il est noté
Le coefficient de variation permet de donner une
idée sur lamplitude de variation en comparant
lécart lécart type et la moyenne, il est noté
Plus le coefficient de variation est petit, plus
la série est homogène. Dune manière générale, la
population étudiée est considérée homogène
lorsque le CV lt 30.