Licence 1re anne Sociologie - PowerPoint PPT Presentation

1 / 83
About This Presentation
Title:

Licence 1re anne Sociologie

Description:

Depuis que les mariages ne sont plus ' arrang s ', les individus choisissent de plus en ... Fiabilit des donn es administratives : statistiques sur le suicide ... – PowerPoint PPT presentation

Number of Views:53
Avg rating:3.0/5.0
Slides: 84
Provided by: sociologi6
Category:

less

Transcript and Presenter's Notes

Title: Licence 1re anne Sociologie


1
  • Licence 1ère année Sociologie
  • TD de Méthodes quantitatives
  • Introduction
  • Nicolas Charles
  • nicolas.charles_at_u-bordeaux2.fr

2
Statistiques et bon sens
  • Depuis que les mariages ne sont plus
     arrangés , les individus choisissent de plus
    en plus leur conjoint en dehors de leur classe
    sociale.
  • Plus on avance dans ses études, plus on lit.
    Ainsi, un étudiant lit en moyenne plus qu'un
    lycéen, qui lui-même lit plus qu'un collégien.

3
Problèmes statistiques
  • Enregistrement statistique des objets socialement
    préconstruits début juillet 2009, un rapport
    dénonce que les instituteurs ont 11 jours de
    congé-maladie par an contre 9 pour les salariés
    du privé.
  • Fiabilité des données administratives
    statistiques sur le suicide
  • Interprétation de liaison statistique âge ou
    génération

4
Mise en perspective
Méthodes en sociologie
Méthodes qualitatives entretien, observation,
etc.
Méthodes quantitatives
Faire une enquête questionnaire, échantillon,
logiciel de statistiques, etc.
Analyser des données statistiques
Analyses multivariées
Analyse des variables quantitatives
Analyse des variables qualitatives
5
  • Licence 1ère année Sociologie
  • TD de Méthodes quantitatives
  • Cours n1 Concepts de base
  • Nicolas Charles
  • nicolas.charles_at_u-bordeaux2.fr

6
Définitions de base
  • Population ensemble étudié
  • Individu élément de la population
  • Echantillon sous-ensemble de la population
  • Caractère propriété étudiée
  • Classe sous-ensemble de la population
    correspondant à une même valeur ou à des valeurs
     voisines  prises par le caractère

7
Exercices - Reconnaître les concepts
  • Parmi l'ensemble des élèves d'un collège, on
    analyse les notes en mathématiques de deux
    classes de 6ème, de 5ème, de 4ème et de 3ème
    chacun. Parmi ces élèves, on analyse en
    particulier ceux dont les notes sont supérieures
    à 15.
  • On analyse l'utilisation des transports en commun
    des 320 000 bordelais. Pour cela, on envoie un
    courrier à 10 000 personnes réparties dans tous
    les quartiers de Bordeaux. Parmi eux, on
    s'intéresse à ceux qui utilisent les transports
    en commun de manière quotidienne.

8
Variables
  • Variable application qui associe à chaque
    individu une valeur unique parmi un ensemble de
    valeurs possibles
  • Variable qualitative (ou catégorielle) variable
    dont les modalités sont non numériques
  • Variable quantitative (ou numérique) variable
    dont les modalités sont numériques (des nombres
    réels)

9
Types de variable
  • Variable qualitative
  • Ordinale s'il existe un ordre sur ses modalités
    (ex niveau de satisfaction, niveau
    hiérarchique)
  • Nominale dans le cas contraire (sexe, religion)
  • Variable quantitative
  • Continue si les modalités sont des nombres d'un
    intervalle (poids, température)
  • Discrète si les modalités sont des valeurs
    isolées (nombre de pièces d'un logement, nombre
    d'enfants d'une famille)

10
Exercices - Reconnaître les variables
  • Nombre de sorties au cinéma
  • Taille du logement
  • Orientation sexuelle
  • Niveau d'études
  • proposez-en d'autres !

11
  • Licence 1ère année Sociologie
  • TD de Méthodes quantitatives
  • Cours n2 Effectifs, fréquences
  • Nicolas Charles
  • nicolas.charles_at_u-bordeaux2.fr

12
Définitions
  • Effectif nombre d'individus présentant une
    modalité d'une variable.
  • Fréquence proportion d'individus présentant une
    modalité d'une variable. Effectif de la case /
    Effectif total
  • Effectif cumulé croissant (ou décroissant)
    nombre d'individus présentant une valeur de la
    variable inférieure (supérieure) ou égale à une
    valeur observée.
  • Fréquence cumulée croissante (ou décroissante)
    proportion d'individus présentant une valeur de
    la variable inférieure (supérieure) ou égale à
    une valeur observée.
  • Lien entre et décimal 5555/1000,55
  • Remarque pour les variables qualitatives
    nominales, les fréquences cumulées n'ont pas
    beaucoup de sens.

13
Exemple
Diplôme le plus élevé parmi la population non
scolarisée de plus de 15 ans en
France
Source INSEE, recensement 2006, population
non scolarisée de plus de 15 ans.
9188/45522 0,202
9188/45522 0,202 (91885582)/45522 0,324
1 1-(9188/45522) 1-0,202 0,798
0,123 0,066 0,238 0,150 0,107 0,114 1
0,390 0,628 0,778 0,886 1
1-((91885582) /45522)0,676 0,610 0,372 0,222
0,114
14
Exercice
Nombre d'individus scolarisés selon l'âge en
2006 Sou
rce INSEE, recensement 2006, population
scolarisée
2380/15266 0,156 15,6
0,156 0,1560,454 0,610 0,6100,154
0,764 0,7640,192 0,956 0,9560,020
0,976 0,9760,025 1,001 ERREUR A EVITER
2380/15266 0,156 15,6 (23806929)/ 152660,6
10
1 1-(2380/15266) 1-0,156 0,844
0,454 0,154 0,192 0,020 0,025 1
1-(23806929)/15266 1-0,610
0,390 0,236 0,044 0,025
0,764 0,956 0,975 1
15
  • Licence 1ère année Sociologie
  • TD de Méthodes quantitatives
  • Cours n3 Tableaux de données chronologiques
  • Nicolas Charles
  • nicolas.charles_at_u-bordeaux2.fr

16
Définitions
  • Ecart absolu c'est l'évolution de la variable
    exprimée dans la mesure utilisée (nombre
    d'individus, revenus en euros, etc.). Calcul
    Valeur d'arrivée Valeur de départ
  • Ecart relatif c'est l'évolution de la variable
    exprimée en pourcentage. Calcul (Valeur
    d'arrivée Valeur de départ)/Valeur de départ
  • Coefficient multiplicateur c'est l'évolution de
    la variable exprimée en multiple. Calcul Valeur
    d'arrivée / Valeur de départ
  • Coefficient multiplicateur 1  Ecart relatif
    ltltlt gtgtgt  Ecart relatif Coefficient
    multiplicateur -1
  • Taux de variation moyen c'est l'évolution
    moyenne de la variable en pourcentage.

17
Ecarts absolus et relatifs
Nombre d'étudiants (en milliers) selon l'année et
le type d'institution S
ource Ministère de l'Education Nationale, 2007,
Repères et Références Statistiques, p. 173

Ecarts entre le nombre d'étudiants à l'unversité
entre 1960 et 1970 Absolu 637-214,7
422,3 Relatif (637-214,7)/214,7
196,7 Attention les écarts peuvent aussi être
négatifs.
18
Exemple - Ecart relatif et coefficient
multiplicateur
Nombre d'étudiants (en milliers) selon l'âge et
le type d'institution Sourc
e Ministère de l'Education Nationale, 2007,
Repères et Références Statistiques, p. 173

Entre le nombre d'étudiants en BTS et IUT entre
1970 et 1990 Ecart relatif (273,6-51)/51
436,5 gtgtgt Le nombre d'étudiants en BTS / IUT a
augmenté de 436,5. Coefficient multiplicateur
273,6/51 5,365 gtgtgt Le nombre d'étudiants en BTS
/ IUT a été multiplié par 5,365. L'écart relatif
et le coefficient multiplicateur sont très
proches. En fait  coefficient multiplicateur 
1  écart relatif 
19
Exemple - Taux de variation moyen
Nombre d'étudiants (en milliers) selon l'âge et
le type d'institution Sou
rce Ministère de l'Education Nationale, 2007,
Repères et Références Statistiques, p. 173

D'abord, comptez le nombre d'années (ou semaines,
etc.). De 1960 à 1990, il y a 30 années
(1990-196030). Ensuite, calculez le coefficient
multiplicateur. Entre 1960 et 1990, le nombre
d'étudiants a été multiplié par 5,26. Le
coefficient multiplicateur moyen est alors
30v(5,26) 1,057, soit une multiplication
moyenne par an de la population par 1,057. Taux
de variation moyen Coefficient multiplicateur
moyen - 1 1,057-1 0,057 5,7, soit une
augmentation de la population en moyenne de 5,7
par an.
20
Exercice 1
12010,21,2
150x(120)180 Ou 150x1,2180
0,85-1-0,15-15 Ou (3000-3529,4) /3529,4 -15
3000/0,853529,4
(1750-500)/500 250 Ou 3,5-12,5250
1750/5003,5
1,1-10,110
750x1,1825 Ou 750x(110)825
Dès que vous avez 3 termes dans la ligne, il y a
toujours 2 manières de calculer le dernier terme.
21
Exercice 2 Taux de variation
  • La population française est passé de 60 millions
    d'habitants en 1999 à 64 millions d'habitants en
    2008. Quelle a été l'évolution moyenne par an de
    la population française entre 1999 et 2008 ?
  • Sur vos calculatrices, vous devez taper le nombre
    d'unités temporelles (racine Xième), puis le
    signe xv, et enfin le coefficient multiplicateur
    entre parenthèse

22
Exercices gtgtgt que savoir faire ?
  • Vous devez pouvoir calculer toutes les relations
    entre écart absolu, écart relatif, valeur de
    départ, valeur d'arrivée,
  • On peut vous demander de calculer une évolution
    moyenne par période de temps (par an par exemple)
    gtgtgt cela renvoie au taux de variation moyen.

23
  • Licence 1ère année Sociologie
  • TD de Méthodes quantitatives
  • Cours n4 Notions d'attraction, de répulsion
    entre deux variables qualitatives
  • Nicolas Charles
  • nicolas.charles_at_u-bordeaux2.fr

24
Définitions
  • Tableau de contingence tableau croisant deux
    caractères d'une population (en ligne et en
    colonne)
  • Effectif (et fréquence) partiel nombre (et
    proportion) d'individus présentant à la fois une
    modalité de la variable en ligne et une modalité
    de la variable en colonne. Effectif de la case /
    effectif total de la population
  • Fréquence conditionnelle proportion d'individus
    présentant une modalité de la variable en colonne
    (ou ligne), pour une ligne (ou colonne) définie.
    Ex si on ne sélectionne que les filles, quelle
    est la proportion de filles qui discutent de
    politique avec leur famille ? Calcul effectif
    de la case / effectif total de la ligne ou de la
    colonne
  • Tableaux des pourcentages en ligne et en colonne
    ce sont les deux tableaux des fréquences
    conditionnelles. Le premier se calcule en ligne,
    le second en colonne.
  • Effectif (et fréquence) marginal nombre (et
    proportion) total d'individus présentant une
    modalité de la variable en colonne (ou ligne),
    quelle que soit la variable en ligne (ou
    colonne). Dans les marges du tableau. En fait,
    une fréquence marginale est aussi à la fois une
    fréquence partielle et une fréquence
    conditionnelle.
  • Attraction / répulsion l'attraction signifie
    que deux modalités s'attirent, que leur
    croisement apparaît plus souvent que d'autres
    croisements du tableau. C'est l'inverse pour la
    répulsion. Il y a attraction si une fréquence
    conditionnelle est plus élevée que la fréquence
    marginale. Il y a répulsion dans le cas inverse.
    Ce calcul permet de repérer rapidement les
    déséquilibres dans le tableau.

25
Exemple - Eff. et fréq. partiels
Question Discutez-vous souvent de politique
avec votre famille ?
Modalités de la variable en colonne
En gras les effectifs et fréquences
partiels 24 221/908
Modalités de la variable en ligne
Effectifs (ou fréquence) marginaux de la variable
en ligne
Effectif total de la population
Effectifs (ou fréquence) marginaux de la variable
en colonne
Source Muxel A., 2001, L'expérience politique
des jeunes, Paris, Presses de Sciences Po, p.
75 Enquête réalisée sur 908 jeunes entre 18 et 30
ans.
26
Exemple - Fréq. conditionnelles
  • Fréquence conditionnelle si on ne sélectionne
    que les filles, quelle est la proportion de
    filles qui discutent de politique avec leur
    famille ?
  • Pour calculer le tableau des en ligne, il faut
    faire les calculs en ligne (39 221/567). Pour
    le tableau des en colonne, il faut faire les
    calculs en colonne (69221/320).
  • Les fréquences conditionelles sont dans deux
    tableaux
  • Tableau des pourcentages en ligne
    Tableau des pourcentages en colonne

Question Discutez-vous souvent de politique
avec votre famille ?
Source Muxel A., 2001, L'expérience politique
des jeunes, Paris, Presses de Sciences Po, p.
75 Enquête réalisée sur 908 jeunes entre 18 et 30
ans.
27
Exemple - Attraction et répulsion
  • Fréquence conditionnelle gt Fréquence marginale
    gtgtgt Attraction ()
  • Fréquence conditionnelle lt Fréquence marginale
    gtgtgt Répulsion (-)
  • Il y a une attraction entre  être une femme  et
     discuter souvent de politique avec sa
    famille . On retrouve les mêmes attractions si
    l'on part du tableau des pourcentages en ligne,
    ou de celui en colonne.
  • Tableau des pourcentages en ligne
    Attraction et répulsion pour les en ligne

Variable Discutez-vous souvent de politique
avec votre famille ?
Source Muxel A., 2001, L'expérience politique
des jeunes, Paris, Presses de Sciences Po, p.
75 Enquête réalisée sur 908 jeunes entre 18 et 30
ans.
28
Exercice
  • Calculer les fréquences partielles (pas
    nécessaire pour repérer les attractions et
    répulsions)
  • Calculer les fréquences conditionnelles
    (c'est-à-dire les tableaux des pourcentages en
    ligne et en colonne)
  • Repérer les attractions et répulsions dans ce
    tableau
  • Tableau Nombre de diplômés selon le domaine
    d'études et selon le sexe
  • Sources Enquête Formation et Qualification
    Professionnelle 2003, 26-35 ans, diplômés du
    supérieur

29
Exercice fréquences partielles
  • Tableau des fréquences partielles
  • Nombre de diplômés selon le domaine d'études et
    selon le sexe
  • Sources Enquête Formation et Qualification
    Professionnelle 2003, 26-35 ans, diplômés du
    supérieur, France

30
Exercice fréquences conditionnelles (1)
  • Tableau des pourcentages en ligne
  • Nombre de diplômés selon le domaine d'études et
    selon le sexe
  • Sources Enquête Formation et Qualification
    Professionnelle 2003, 26-35 ans, diplômés du
    supérieur, France

31
Exercice fréquences conditionnelles (2)
  • Tableau des pourcentages en colonne
  • Nombre de diplômés selon le domaine d'études et
    selon le sexe
  • Sources Enquête Formation et Qualification
    Professionnelle 2003, 26-35 ans, diplômés du
    supérieur, France

32
Exercice attraction et répulsion
  • Tableau des attractions et des répulsions
  • Nombre de diplômés selon le domaine d'études et
    selon le sexe
  • Sources Enquête Formation et Qualification
    Professionnelle 2003, 26-35 ans, diplômés du
    supérieur, France
  • On peut donc dire qu'il y a une attraction entre
    le fait d'être une femme et le fait d'être
    diplômé dans la santé ou le social.

33
Exercices gtgtgt que savoir faire ?
  • On peut vous demander de calculer la proportion
    d'une population particulière dans la population
    totale (fréquence partielle), ou dans la
    population totale de la ligne (tableau des
    pourcentages en ligne) ou de la colonne (tableau
    des pourcentages en colonne)
  • Pour calculer le tableau des pourcentages en
    ligne, il faut faire les calculs en ligne. Pour
    le tableau des pourcentages en colonne, il faut
    faire les calculs en colonne.
  • Pour trouver des attractions et répulsions, vous
    n'avez besoin de faire qu'un seul des deux
    tableaux de pourcentages (en ligne ou en
    colonne), car ils donnent les mêmes attractions
    et répulsions. Vous n'avez pas besoin de calculer
    les fréquences partielles.

34
  • Licence 1ère année Sociologie
  • TD de Méthodes quantitatives
  • Point d'étape qu'avons-nous fait et
    qu'allons-nous faire ?
  • Nicolas Charles
  • nicolas.charles_at_u-bordeaux2.fr

35
Qu'avons-nous fait jusqu'à présent ?
  • Des tableaux de répartition...
  • Calculer des proportions de population
    fréquences et fréquences cumulées
  • Calculer des variations dans le temps variation
    moyenne ou variation sur toute la période

36
Exemple 1
Diplôme le plus élevé parmi la population non
scolarisée de plus de 15 ans en
France
Source INSEE, recensement 2006, population
non scolarisée de plus de 15 ans.
37
Exemple 2
Nombre d'étudiants (en milliers) selon l'année et
le type d'institution
Source Ministère de l'Education Nationale,
2007, Repères et Références Statistiques, p. 173

38
Que faisons-nous désormais ?
  • Des tableaux de contingence (croisement de
    modalités en ligne et en colonne)
  • Repérer des attractions et des répulsions gtgtgt
    y-a-t-il un lien entre deux modalités ?
  • Calculer le Khi deux gtgtgt y-a-t-il une corrélation
    statistiquement significative entre les deux
    variables ?
  • Calculer le V de Cramer et le Phi gtgtgt Quelle est
    l'intensité de cette corrélation forte,
    moyennement forte, faible, très faible ?
  • Calculer les PEM gtgtgt De quelles cases du tableau
    (ou croisements de modalités) provient
    l'intensité de cette corrélation ?

39
Exemple
Réponse à la question   Dans quelle mesure
êtes-vous daccord avec l'affirmation suivante ?
Les gens de mon pays ont la possibilité de
choisir leur propre vie. (échelle de 1 à
7)  Sources Stellinger A.,
Wintrebert R., 2008, Les jeunesses face a
leur avenir. Une enquete
internationale, Fondation pour l'inn
ovation politique, p. 11. 1000 jeunes de chaque
pays. ?21112,29 ce qui signifie
(nous verrons pourquoi plus tard)
qu'il y a une corrélation significative à
plus de 95 entre la nationalité et le
fait qu'un individu pense que les
gens de son pays ont la possibilité
de choisir leur propre vie. V 0,37
donc l'intensité de la corrélation est
faible, c'est-à-dire que le lien
entre la nationalité et le fait qu'un individu
pense que les gens de son pays ont la
possibilité de choisir leur propre vie est
faible. Le PEM est très élevé pour les Etats-Unis
( 38,58 et 67,12), le Danemark ( 37,01 et
64,38) et le Japon ( 49,61 et 86,30). Ce sont
donc ces cases qui contribuent le plus à
l'intensité de ce lien Interprétation
sociologique la nationalité a une influence
très faible sur le niveau d'optimisme des jeunes.
Les cas déviants sont notamment le Danemark et
les Etats-Unis (très optimistes) et le Japon où
la jeunesse est quant à elle très pessimistes.
40
  • Licence 1ère année Sociologie
  • TD de Méthodes quantitatives
  • Cours n 5 Notion d'indépendance entre deux
    variables qualitatives
  • Nicolas Charles
  • nicolas.charles_at_u-bordeaux2.fr

41
Définitions
  • Indépendance dans le cas où il n'y a ni
    attraction ni répulsion, c'est-à-dire si les
    fréquences conditionnelles sont égales à la
    fréquence marginale.
  • Effectif théorique nombre d'individus dans la
    situation d'indépendance. Calcul (effectifs
    marginaux (somme) de la ligne x effectifs
    marginaux (somme) de la colonne) / effectif
    total de la population

42
Effectifs théoriques (si indépendance)
  • 35 des enquêtés répondent  oui  donc, s'il y
    avait indépendance, 35 des filles devraient
    répondre  oui .
  • 62 des répondants sont des filles donc, s'il y
    avait indépendance, 62 de ceux qui répondent
     oui  devraient être des filles.

Si les garçons et les filles discutaient autant
de politique avec leur famille, voici le tableau
théorique de données que nous aurions.
Calcul des eff. théoriques (effectifs marginaux
de la ligne x effectifs marginaux de la colonne)
/ effectif total
43
Exemple - Effectifs théoriques
Calcul des eff. théoriques (effectifs marginaux
de la ligne x effectifs marginaux de la colonne)
/ effectif total On utilise donc les effectifs
marginaux réels pour calculer les effectifs
théoriques à l'intérieur du tableau.
44
Exemple - Ecart à l'indépendance
  • A ce stade, on pose l'hypothèse H0 qu'il y a
    indépendance entre les variables. L'autre
    hypothèse (H1) serait qu'il existe une
    corrélation entre les variables. H0 est souvent
    ce que l'on cherche à réfuter.
  • Ecart à l'indépendance
  • Tableau des effectifs réels - Tableau des
    effectifs théoriques

45
Exercice
  • Calculer les effectifs théoriques
  • Calculer les écarts à l'indépendance
  • Tableau Nombre de diplômés selon le domaine
    d'études et selon le sexe
  • Sources Enquête Formation et Qualification
    Professionnelle 2003, 26-35 ans, diplômés du
    supérieur, France

Effectif théorique pour les femmes et la santé
1632x284/2994 154,8 Ecart à l'indépendance
224 154,8 69,2
46
Exercice effectifs théoriques
  • Tableau Nombre de diplômés selon le domaine
    d'études et selon le sexe
  • Sources Enquête Formation et Qualification
    Professionnelle 2003, 26-35 ans, diplômés du
    supérieur, France

47
Exercice écarts à l'indépendance
  • Nombre diplômés selon le domaine d'études et
    selon le sexe
  • Sources Enquête Formation et Qualification
    Professionnelle 2003, 26-35 ans, diplômés du
    supérieur, France

48
  • Licence 1ère année Sociologie
  • TD de Méthodes quantitatives
  • Cours n6 et 7 Test du ?2
  • Nicolas Charles
  • nicolas.charles_at_u-bordeaux2.fr

49
Définitions du Khi deux
  • Le calcul du ?2 (écrit aussi Khi deux et prononcé
     qui deux ) permet d'établir des corrélations
    (pas des causalités) entre deux variables
    nominales.
  • Le ?2 permet de valider que l'indépendance a une
    signification statistique réelle et n'est pas due
    au simple hasard. L'objectif est d'inférer
    l'existence de caractéristiques constantes au
    niveau de la population de référence.

50
Règles d'utilisation
  • Le Khi se calcule uniquement
  • Pour deux variables nominales.
  • Si plus de 20 des cases des effectifs théoriques
    sont inférieures à 5.
  • Le Khi deux n'a pas d'utilité si
  • On travaille sur un échantillon de grande taille
    (car on sait que c'est significatif)
  • L'écart entre fréquences observées et théoriques
    est faible (car on sait déjà que ce ne sera pas
    significatif)

51
Etapes du calcul du Khi deux
  • Calcul Khi deux S(Eff. réels Eff.
    théor.)²/Eff. théor.
  • Pour chacune des cases du tableau (sauf les
    marges) les Khi deux partiels ou Khi deux par
    case
  • Calculer les effectifs théoriques.
  • Les retrancher aux effectifs réels (Eff. réels
    Eff. théor.).
  • Mettre au carré chacun de ces nombres. (Eff.
    réels Eff. théor.)²
  • Les diviser par les effectifs théoriques. (Eff.
    réels Eff. théor.)²/Eff. théor.
  • Faire la somme de tous ces nombres.
  • Remarque si le degré de liberté 1, alors le
    calcul du Khi deux est légèrement différent, mais
    la différence est très faible et nous en
    resterons à ce calcul identique pour cette année.

52
Exemple
Tableau Réponse à la question   Dans quelle
mesure êtes-vous daccord avec l'affirmation
suivante ? Mon avenir est prometteur. (échelle
de 1 (pas d'accord du tout) à 7)  ?2
59,4371,304655,21 231,94 Sources Données
légèrement modifiées dans l'intérêt de
l'exercice. Stellinger A., Wintrebert R., 2008,
Les jeunesses face a leur avenir. Une enquete
internationale, Fondation pour l'innovation
politique, p. 8. 1000 jeunes Français et 1000
jeunes Danois de 16 à 29 ans.
53
Exercice (1)
Tableau Réponse à la question   Dans quelle
mesure êtes-vous daccord avec l'affirmation
suivante ? Les gens de mon pays ont la
possibilité de choisir leur propre vie. (échelle
de 1 à 7)  Sources Stellinger
A., Wintrebert R., 2008, Les jeunesses face a
leur avenir. Une enquete internationale,
Fondation pour l'innovation politique, p. 11.
1000 jeunes de chaque pays.
Eff. théorique 2920x1000/8000 365 Khi deux
partiel (430-365)²/36511,58
54
Exercice (2)
Tableau Réponse à la question   Dans quelle
mesure êtes-vous daccord avec l'affirmation
suivante ? Les gens de mon pays ont la
possibilité de choisir leur propre vie. (échelle
de 1 à 7)  ?21112,29 Sources
Stellinger A., Wintrebert R., 2008, Les jeunesses
face a leur avenir. Une enquete
internationale, Fondation pour
l'innovation politique, p. 11. 1000 jeunes de
chaque pays.
55
  • Licence 1ère année Sociologie
  • TD de Méthodes quantitatives
  • Cours n8 et 9 Les étapes de l'interprétation
    du Khi deux
  • Nicolas Charles
  • nicolas.charles_at_u-bordeaux2.fr

56
Etapes de l'interprétation du Khi deux
  • Significativité du ?2 lire le nombre
    correspondant dans le tableau du ?2 de Pearson,
    et en déduire s'il existe un lien statistiquement
    significatif.
  • Si significatif, intensité du lien calculer le
    V de Cramer (V) ou le Phi (F).
  • Calcul du PEM pour préciser l'intensité de la
    relation

57
  • Licence 1ère année Sociologie
  • TD de Méthodes quantitatives
  • Cours n8 Significativité et intensité du lien
  • Nicolas Charles
  • nicolas.charles_at_u-bordeaux2.fr

58
Définitions (1)
  • Degré de liberté (ddl) il est égal à
    (Nc-1)x(Nl-1) avec Nc le nombre de modalités de
    la variable en colonne et Nl le nombre de
    modalités de la variable en ligne. Sert dans le
    calcul puis l'interprétation du Khi deux.
  • Tableau de Pearson tableau de valeurs (que vous
    n'avez pas à apprendre !! Il vous sera donné en
    annexe à l'examen) qui permet d'analyser la
    significativité de l'indépendance des deux
    variables. Il met en relation la valeur du Khi
    deux avec le degré de liberté (plus il y a de
    cases dans un tableau, plus le Khi deux est
    automatiquement élevé) et le coefficient a qui
    est le seuil de risque (plus il est faible, plus
    la probabilité que la relation soit significative
    est élevé on prend habituellement a0,05, qui
    correspond à une probabilité de 95).
  • Si Khi deux global gt Khi deux théorique alors la
    relation est statistiquement significative à XX
  • On distingue les Khi deux partiels ou par cas
    (ceux dans chacune des cases) et le Khi deux
    global (la somme de tous les Khi deux partiels ou
    par case).

59
Définitions (2)
  • V de Cramer (V) indicateur statistique mesurant
    l'intensité du lien entre deux variables
    qualitatives pour les tableaux avec ddlgt1. Calcul
    v(?2/(Nx(k-1))) où ?2 est le Khi deux, N la
    taille de l'échantillon et k le nombre de
    modalités de la variable qui en a le moins.
  • Phi (F) indicateur statistique mesurant
    l'intensité du lien entre deux variables
    qualitatives pour les tableaux avec ddl1. Calcul
    v(?2/N) où ?2 est le Khi deux, N la taille de
    l'échantillon. Le Phi n'est qu'un cas particulier
    du V de Cramer (si k2).
  • Ces deux indicateurs sont des coefficients de
    corrélations. Ils sont compris entre 0 et 1. Plus
    la valeur se rapproche de 0, plus le lien
    statistique entre les deux variables est nul.
    Plus la valeur se rapproche de 1, plus le lien
    statistique entre les deux variables est élevés.
  • Il faut donc retenir l'interprétation suivante

60
Exemple (1)
Tableau des Khi deux partiels Réponse à la
question   Dans quelle mesure êtes-vous daccord
avec l'affirmation suivante ? Mon avenir est
prometteur. (échelle de 1 à 7)  ?2
59,4371,304655,21 231,94 Sources Données
légèrement modifiées dans l'intérêt de
l'exercice. Stellinger A., Wintrebert R., 2008,
Les jeunesses face a leur avenir. Une enquete
internationale, Fondation pour l'innovation
politique, p. 8. 1000 jeunes Français et 1000
jeunes Danois de 16 à 29 ans.
61
Exemple (2) significativité et intensité du lien
Tableau Réponse à la question   Dans quelle
mesure êtes-vous daccord avec l'affirmation
suivante ? Mon avenir est prometteur (échelle de
1 à 7 deux modalités entre 1 et 5 puis 6 et
7)  ?2231,94 Degré de liberté 2 colonnes et
2 lignes donc ddl (2-1) x (2-1) 1
Significativité Il y a une corrélation
statistiquement significative à plus de 95 (car
231,94gt3,84) (et même à plus de 99,9 car
231,94gt10,83) entre sa nationalité et le fait de
penser que mon avenir est prometteur ou
non. Intensité F v(?2/N) v(231,94/2200)
0,32. Donc l'intensité du lien entre ces deux
variables est faible.
62
Exercice (1)
Tableau Réponse à la question   Dans quelle
mesure êtes-vous daccord avec l'affirmation
suivante ? Les gens de mon pays ont la
possibilité de choisir leur propre vie. (échelle
de 1 à 7)  ?21112,29 Sources
Stellinger A., Wintrebert R., 2008, Les jeunesses
face a leur avenir. Une enquete
internationale, Fondation pour
l'innovation politique, p. 11. 1000 jeunes de
chaque pays.
63
Exercice (2) significativité et intensité du
lien
Tableau Réponse à la question   Dans quelle
mesure êtes-vous daccord avec l'affirmation
suivante ? Les gens de mon pays ont la
possibilité de choisir leur propre vie. (échelle
de 1 à 7 (échelle de 1 à 7 deux modalités
entre 1 et 5 puis 6 et 7)  ?21112,29 Degré de
liberté 2 colonnes et 8 lignes donc ddl (2-1)
x (8-1) 7 a0,05 Il y a une corrélation
significative à plus de 95 (car 1112,29gt14,07)
(et même à plus de 99,9 car 1112,29gt24,32) entre
sa nationalité et le faire de penser que les gens
de mon pays ont la possibilité de choisir leur
propre vie. V v(?2/(Nx(k-1)))
v(1112,29/(8000x(2-1))) 0,37. Donc l'intensité
du lien entre ces deux variables est faible.
64
Exercices gtgtgt que savoir faire ?
  • On peut vous demander de dire si deux variables
    sont corrélées de façon statistiquement
    significative
  • Repérer ou calculer le Khi deux
  • Calculer le ddl (degré de liberté)
  • Repérer le seuil de risque
  • Comparer le Khi deux au chiffre dans le tableau
    de Pearson
  • En déduire la significativité
  • On peut vous demander l'intensité de la relation
  • Vous avez déjà calculé le ddl avant
  • Si ddl 1 gtgtgt Calcul de Phi
  • Si ddl gt 1 gtgtgt Calcul de V de Cramer
  • En déduire l'intensité à partir du tableau de
    correspondance des valeurs de Phi et de V de
    Cramer.

65
Corrigé Séance 6 Ex. 1 (1)
Question 1 1) 103/114 92,0 gtgtgt 92,0 des
lycéens interrogés à Marseille supportent
l'équipe de Marseille 2) 103/151 68,2 gtgtgtgt
68,2 des supporters de Marseille interrogés
habitent à Marseille.
66
Corrigé Séance 6 Ex. 1 (2)
Question 2 Tableaux des Khi deux
partiel Khi deux 311,31 et ddl
(3-1)x(3-1) 4 D'après la lecture dans le
tableau de Pearson, les variables  Habitant de
la ville  et  Supporter de l'équipe de la
ville  sont corrélées de manière statistiquement
significative à 95 (car 311,31gt9,488) et même à
99,9 (car 311,31gt18,467).
67
Corrigé Séance 6 Ex. 1 (3)
Question 3 On utilise le V de Cramer car
ddlgt1. k 3 N 331 ?2 311,31 V
v(311,31/(331x(3-1))) v(311,31/662) 0,69 Le
lien statistique entre les deux variables est
d'une force moyenne. Question 4 Il existe un
lien entre le fait d'habiter une ville et le fait
de supporter l'équipe de cette ville. Cette
relation est assez forte dans l'ensemble. On peut
supposer qu'au-delà de l'attachement d'un lycéen
à l'équipe de sa ville, il existe aussi une
pression à la conformité chez les lycéens, qui se
doivent de supporter l'équipe préférée du goupe
de pairs.
68
Corrigé Séance 6 Ex. 2 (1)
Question 1 Tableaux des Khi deux
partiels Khi deux 947,1 et ddl
(2-1)x(2-1) 1 Il existe une relation
statistiquement significative entre la situation
électorale de départ des candidats et leur
performance électorale à 95 (car 947,1gt3,841) et
même à 99,9 (car 947,1gt10,827).
69
Corrigé Séance 6 Ex. 2 (2)
Question 2 ?2 701,7 et ddl (2-1)x(2-1)
1 Il existe une relation statistiquement
significative entre la situation électorale de
départ des candidats et leur profil à 95 (car
701,7gt3,841) et même à 99,9 (car
701,7gt10,827). Question 3 Les deux tableaux
montrent des relations statistiquement
significatives. Le premier tableau montre que les
candidats sortants sont beaucoup plus souvent
élus que les candidats non sortants. Or le
tableau 2 montre qu'il existe un lien entre le
fait d'être un professionnel ou un notable et le
fait d'être un sortant à une élection. Il y
aurait presque ainsi deux expériences distinctes
de la politique celle des professionnels et
notables, beaucoup plus souvent élus et sortants
et celle des autonomes et militants, souvent
battus, et moins souvent sortants. En quelque
sorte, l'élection fait probablement passer les
militants et les autonomes à un nouveau statut
pour l'élection suivante, celle de notable et de
professionnel de la politique, avec une certaine
institutionnalisation de leur candidature
(soutiens d'un parti, d'associations, etc.). Les
deux tableaux posent aussi la question du rôle du
financement dans le monde politique faut-il
être bien financé pour avoir une chance d'être
élu ?
70
  • Licence 1ère année Sociologie
  • TD de Méthodes quantitatives
  • Cours n9 Calcul du PEM
  • Nicolas Charles
  • nicolas.charles_at_u-bordeaux2.fr

71
Définition PEM
  • Cas déviant en statistiques, c'est un cas qui
    s'éloigne beaucoup de la moyenne.
  • PEM (Pourcentage de l'écart maximum) c'est un
    indice simple de liaison entre deux variables
    d'un tableau de contingence. Plus le pourcentage
    est élevé, plus la liaison est forte. En clair,
    il permet de calculer l'intensité de la relation
    d'un tableau, mais il est plus précis que le Phi
    ou le V de Cramer, et permet ainsi de conclure
    précisément sur l'intensité de la variable.
  • Calcul des PEM
  • Somme des écarts positifs de la situation réelle/
    somme des écarts positifs de la situation
    maximale
  • Etapes du calcul
  • Calculer le tableau des attractions (peut-être
    déjà fait dans l'exercice précédent)
  • Calculer le tableau des écarts à l'indépendance
    (effectifs réels effectifs théoriques)
  • Calculer le tableau des effectifs de dépendance
    maximum
  • Calculer le tableau des écarts à l'indépendance
    maximale (effectifs de dépendance max effectifs
    théoriques)
  • Faire la somme des écarts positifs de la
    situation réelle. Et les diviser par la somme des
    écarts positifs de la situation maximale.
  • Interprétation du PEM
  • en dessous de 5 les PEM correspondent à des
    attractions et répulsions en général
    négligeables,
  • que 10 constitue un seuil au-dessus, les PEM
    sont en général intéressants, entre 5 et 10,
    les liaisons peuvent lêtre ou non,
  • que des liaisons supérieures à 50 sont
    exceptionnelles et manifestent souvent quon a
    affaire à deux indicateurs dun même phénomène.

72
Exemple PEM (1)
  • D'abord le tableau des attractions et des
    répulsions
  • Nombre de diplômés selon le domaine d'études et
    selon le sexe
  • Sources Enquête Formation et Qualification
    Professionnelle 2003, 26-35 ans, diplômés du
    supérieur, France

73
Exemple PEM (2)
  • Puis le tableau des effectifs théoriques
  • Tableau Nombre de diplômés selon le domaine
    d'études et selon le sexe
  • Sources Enquête Formation et Qualification
    Professionnelle 2003, 26-35 ans, diplômés du
    supérieur, France

74
Exemple PEM (3)
  • Puis le tableau des écarts à l'indépendance
  • Nombre diplômés selon le domaine d'études et
    selon le sexe
  • Sources Enquête Formation et Qualification
    Professionnelle 2003, 26-35 ans, diplômés du
    supérieur, France
  • La somme des écarts positifs à l'indépendance est
    533,7.

75
Exemple PEM (4)
  • Puis le tableau des effectifs de dépendance
    maximum suivez les étapes pour le calculer
  • Il faut partir d'une des cases dans un coin du
    tableau (disons en haut à droite) et entrer le
    nombre maximum d'individus possibles (qui
    correspond au minimum du total en ligne et total
    en colonne).
  • Tableau Nombre de diplômés selon le domaine
    d'études et selon le sexe

76
Exemple PEM (5)
  • Puis le tableau des écarts à l'indépendance
    maximale
  • Nombre diplômés selon le domaine d'études et
    selon le sexe
  • Sources Enquête Formation et Qualification
    Professionnelle 2003, 26-35 ans, diplômés du
    supérieur, France
  • La somme des écarts positifs à l'indépendance
    maximale est 1367,5.
  • Donc PEM 533,7/1367,5 39,03 gtgtgt Le lien
    entre les deux variables est donc relativement
    fort.

77
  • Licence 1ère année Sociologie
  • TD de Méthodes quantitatives
  • Conseils pour l'examen
  • Nicolas Charles
  • nicolas.charles_at_u-bordeaux2.fr

78
Que faire pendant l'examen ?
  • Comprendre l'énoncé repérer la population,
    l'échantillon, le caractère étudié, mais aussi la
    nature de la variable. Ne pas lire trop
    rapidement...
  • Comprendre le type de calculs à faire repérer
    dans les questions et le tableau s'il s'agit de
    données chronologiques, de notion d'indépendance,
    de test du Khi deux, etc.
  • Utiliser correctement sa calculatrice vérifier
    deux fois d'avoir bien taper les bons chiffres
    sur sa calculatrice, ne pas se tromper dans les
    arrondis, ne pas oublier les parenthèses.
  • Avoir un regard critique sur son travail se
    relire, repérer les résultats incongrus (erreur
    d'échelle, etc.), limiter les  pattes de
    mouche , bien réfléchir à l'analyse sociologique
    que vous portez.
  • Ne pas abandonner l'exercice si vous n'y arrivez
    pas lire les questions suivantes (ça vous
    donnera des idées) et revenir à l'exercice en fin
    de devoir.

79
Comment répondre ?
  • Ecrire lisiblement et dans un français correct.
  • Lire l'énoncé proportion ou fréquence gtgtgt ou
    décimal ?
  • Mettre le bon nombre de chiffres après la
    virgule.
  • Faîtes ce que l'on vous demande un  tableau 
    nécessite de faire un tableau...
  • Détailler vos calculs. Pour les tableaux,
    détailler une première case, puis mettre
    uniquement le résultat dans les autres cases.

80
A quoi savoir répondre ?
  • Reconnaître les 4 types de variable.
  • Calculer une proportion / fréquence, et une
    fréquence cumulée (dé)croissante.
  • Calculer un écart absolu, un écart relatif et un
    coefficient multiplicateur.
  • Calculer une variation dans le temps, y compris
    un taux de variation moyen.
  • Calculer un tableau des attractions / répulsions,
    un Khi deux, un V de Cramer, un Phi, un
    pourcentage de l'écart maximal (PEM).
  • Faire un tableau des effectifs théoriques, un
    tableau des écarts à l'indépendance.
  • Montrer qu'il existe ou pas une relation
    statistiquement significative entre deux
    variables qualitatives (Khi deux), et si oui, en
    calculer l'intensité du lien (V de Cramer et
    Phi), calculer le PEM.
  • Interpréter sociologiquement vos résultats.

81
Comment présenter les tableaux ?
  • Mettre les détails dans les premières cases des
    tableaux.
  • Ecrire des légendes pour vos calculs si vous
    écrivez plusieurs résultats dans un même tableau
    (eff. Théorique, écarts à l'indépendance, Khi
    deux partiels, etc.)

82
Exemple de présentation pour l'examen (1)
  • Tableau des pourcentages en ligne
  • Nombre de diplômés selon le domaine d'études et
    selon le sexe
  • Sources Enquête Formation et Qualification
    Professionnelle 2003, 26-35 ans, diplômés du
    supérieur, France

83
Exemple de présentation pour l'examen (2)
Tableau du Khi deux Réponse à la question  
Dans quelle mesure êtes-vous daccord avec
l'affirmation suivante ? Les gens de mon pays
ont la possibilité de choisir leur propre vie.
(échelle de 1 à 7)  ?2151,3164,4515,41
49,9311,58271,8530,216,6586,9795,538,8628,
76,65156,2617,36 1112,29
Write a Comment
User Comments (0)
About PowerShow.com