Title: INF L14 Initiation aux statistiques
1INF L14Initiation aux statistiques
2 Concepts généraux
2Plan
- Quest-ce que la statistique ?
- Quelques éléments de terminologie
3Première partieQuest-ce que la statistique ?
4Statistique
- Latin status état
- Définition
- Une étude statistique consiste à observer et à
étudier une particularité commune chez un groupe
de personnes ou de choses. - Exemples
- Les notes dun groupe délèves
- Le taux de mortalité par cancer des fumeurs
- La fréquence des mots dun texte
- etc.
5Deux domaines
- Statistique descriptive
- exploration des données
- mesures et indices
- représentations graphiques
- Statistique inférentielle
- tester des hypothèses
- faire des prédictions à partir déchantillons
Dans ce cours statistique descriptive
Inférence. Opération par laquelle on passe d'une
vérité à une autre vérité, jugée telle en
fonction de son lien avec la première. (Petit
Larousse)
6Exemples (1)
- Lorsque
- je calcule la moyenne dune classe
- je trace la courbe dévolution du chômage en 2004
- je fais de la statistique descriptive
- Lorsque
- je me demande si leffet dun médicament est réel
ou sil est imputable au hasard - jessaie de prédire des intentions de vote à
partir dun échantillon de 1000 personnes - je fais de la statistique inférentielle
7Exemples (2)
- Statistique descriptive
- La longueur des phrases dans le Petit Prince est
de 9,8 mots.
- Statistique inférentielle
- La longueur des phrases dans le Petit Prince est
significativement plus courte que dans le journal
Le Monde (25 mots)
8Exemples (3)
- Statistique descriptive
- Jésus est le mot (plein) le plus fréquent dans
chacun des 4 évangiles
Marc Matthieu Luc Jean
JÉSUS JÉSUS JÉSUS JÉSUS
HOMME FILS FILS PÈRE
DIEU HOMME DIEU DIEU
DISCIPLES DISCIPLES HOMME MONDE
FOULE PÈRE SEIGNEUR VÉRITÉ
9Question...
- Statistique descriptive
- Le mot Jésus est-il plus fréquent dans certains
évangiles que dans dautres ?
Marc Matthieu Luc Jean
180 198 216 261
Attention, avant de conclure! les textes nont
pas la même longueur...
10Réponse...
- Oui
- les fréquences diffèrent significativement
Cohérent avec les données historiques
Cest-à-dire différences pas imputables au hasard
11Réponse...
- Oui
- les fréquences diffèrent significativement
Cohérent avec les données historiques
Cest-à-dire différences pas imputables au hasard
12Deuxième partieQuelques éléments de
terminologie
13Terminologie
- Rappel
- Une étude statistique consiste à observer et à
étudier une particularité commune chez un groupe
de personnes ou de choses.
population
individus
variable (ou attribut, caractère)
14Population
- Définition
- On appelle population lensemble de tous les
objets que lon étudie. - Exemples
- Des personnes
- Un groupe délèves, un groupe de malade, la
population française - Mais aussi
- Les mots dun texte, un ensemble de documents,
etc.
15Individus
- Définition
- Les individus sont les éléments de la population
étudiée. - Exemples
- chacune des personnes interrogées pour une
enquête - chaque jour de l'année pour lequel on dispose de
données météorologiques - chaque mot dun texte
- chaque texte dun corpus
- etc.
16Variables
- Définition
- Une variable est une propriété commune aux
individus de la population que l'on souhaite
étudier. - On dit aussi
- Attribut, caractère
- Exemples
- La taille de personnes, la couleur de leurs yeux,
leur sexe - Le nombre de lettres des mots, la durée des
pauses dans un discours, le genre d'un texte
(roman, poésie, etc.)
17Types de variables
- Les variables étudiées peuvent être
- Qualitatives
- sexe, profession
- genre des textes (roman, poésie, etc. ),
catégories grammaticales des mots (nom, verbe,
etc.) - Quantitatives
- taille, poids, âge, taux de cholestérol
- longueur, catégorie grammaticale des mots
- durée des pauses dans un discours
18Modalités
- Définition
- Les modalités d'une variable qualitative sont les
différentes valeurs que celle-ci peut prendrei. - Exemple
- variable situation familiale célibataire,
marié, veuf, divorcé. - variable sexe homme, femme.
- variable prénom Alice, Bernard, Charles, ...
(modalités très nombreuses!)
19Variables quantitatives
- Les variables quantitatives sont de deux types
- Discrètes valeurs dénombrables (ex. nombres
entiers) - Exemples
- nombre d'enfants par famille, nombre de pièces
d'un appartement - nombre de mots dun texte, nombre de lettres dun
mot - Continues infinité de valeurs, aussi proches
quon veut (ex. nombres réels) - Exemples
- taille, poids, des personnes
- durée des pauses dun discours, fréquence
fondamentale de la voix
20Mesure ou dénombrement ?
- On dénombre les individus dans telle ou telle
modalité dune variable qualitative - 65 personnes aux yeux bleus
- 44 personnes aux yeux marron
- etc.
- On mesure les variables quantitatives
- taille de lindividu X 1,75 m
21Termes à retenir
- Statistique descriptive
- Statistique inférentielle
- Population
- Individu
- Variable
- Variable qualitative
- Variable quantitative
- Modalité