Title: Partie 5
1Partie 5
2Partie 5 - Les échelles de mesure
- Chapitre 1 Introduction
- Chapitre 2 Echelles de Thurstone
- Chapitre 3 Echelles de Likert
- Chapitre 4 Echelles de Guttman
- Chapitre 5 Modèle de Rasch
- Chapitre 6 Conclusion
3Attitude
- disposition personnelle commune à un ensemble
dindividus, possédée à différents degrés, qui
les conduit à réagir à des objets, à des
situations ou à des propositions dune façon que
lon peut qualifier de favorable ou de
défavorable. - tendance à réagir favorablement ou
défavorablement à travers une classe désignée de
stimuli. Lattitude ne peut pas être directement
observée, mais doit être inférée daprès des
comportements verbaux ou non verbaux manifestes.
4Compétence / performance
- si on observe bel et bien certaines performances,
c'est en général aux aptitudes ou aux compétences
des sujets que l'on s'intéresse, lestimation des
compétences étant susceptible de permettre la
prédiction de nouvelles performances. - // attitude
5Objectif des échelles
- établir un critère pour évaluer la plus ou moins
grande adéquation de données empiriques par
rapport à un modèle théorique. - décrire la structure de données, de façon à
mettre en évidence une dimension sous-tendant
celles-ci. Dans ce cas, aucune hypothèse n'est
nécessairement testée. La perspective est alors
principalement exploratoire. - situer chaque sujet sur une échelle et l'évaluer
par rapport à tous les autres ou d'introduire la
valeur individuelle obtenue dans un modèle
explicatif ou prédictif.
6Qualités des échelles
- Unidimensionnalité
- Linéarité et intervalles égaux
- Fidélité
- Validité
- Reproductibilité
- Réfléchir au modèle théorique / dimensions
sous-jacentes
7Quatre grandes méthodes
- La première méthode est basée sur le classement
des stimuli à mettre en échelle. - La seconde consiste à émettre un jugement sur
chacun des items pris séparément. - La troisième méthode se base sur la comparaison
des stimuli entre eux (en terme de A est
plus... ou est moins... que B ). - La dernière méthode met en œuvre des comparaisons
en terme de similarité (par exemple, A est plus
semblable à B qu'à C ).
8Thurstone
- L'échelle postulée par Thurstone est une échelle
psychologique non précisée, contrairement à
l'échelle de Fechner qui postule une réelle
échelle de sensation. En particulier, l'approche
de Thurstone ne nécessite nullement d'utiliser
des stimuli possédant une métrique physique.
Thurstone (1959) s'intéressait en particulier à
l'obtention d'échelles d' excellence de
l'écriture , de la gravité des crimes , de la
préférence pour les nationalités . En
psychologie sociale, un grand nombre d'échelles
d'attitude sont construites sur cette base.
(Bonnet, 1986, p. 136)
9(No Transcript)
10Thurstone
- Ce type déchelles repose sur deux
étapes distinctes - la mise au point de léchelle
- son utilisation pratique.
11Mise au point de léchelle
- Comparaisons pairées
- Classement par des juges
12?
13 14 15La situation
- Pour des raisons de simplification, nous allons
considérer, pendant la première étape que nous
demanderons à un échantillon de 100 personnes, de
classer une série de propositions relatives au
divorce dans l'une des 7 catégories allant de
propositions acceptées par les personnes les
plus défavorables au divorce à propositions
acceptées par les personnes résolument en faveur
du divorce de manière à dégager un continuum de
propositions.
16Quelques items (exemples)
- Les conditions actuelles du divorce ne sont pas
aussi déshonorantes qu'il apparaît. - Le divorce est scandaleux.
- Une personne devrait avoir le droit de se marier
ou de divorcer aussi souvent qu'elle le voudrait.
17Fréquences cumulées
18Notes Z
19Ecarts entre classes
20(No Transcript)
21(No Transcript)
22(No Transcript)
23(No Transcript)
24Critiques
- Problème dunidimensionnalité (existence dun
véritable continuum) - Complexité de la création déchelles
- Utilisation de juges
25En résumé
- Deux phases
- Mise au point de léchelle
- Utilisation de léchelle
26Création de léchelle de Likert
- 1 seule étape création et utilisation
- Définition a priori des valeurs des échelons
- Validation lors dun prétest (analyse de
lunidimensionnalité analyse factorielle)
27(No Transcript)
28(No Transcript)
29Critiques
- Unidimensionnalité et existence de la dimension
- Échelons a priori
- Mais économie et facilité
- Applications nombreuses
30Principe général des échelles de Guttman
- Chaque item peut recevoir une réponse positive ou
négative. Les individus peuvent être situés sur
l'échelle à partir de leur patron de réponses. A
un score donné correspond un seul patron de
réponses.
31Echelle de Guttman
Mais, il n existe aucun sujet - qui aurait
réussi l item n3, mais pas le n1 et le n2, -
qui aurait réussi l item n2, mais pas le n1.
32Echelle de Guttman
33Echelle de Guttman
0000
1000
1100
1111
34(No Transcript)
35Ordonner les scores de sujets
36Ordonner les proportions de réussite aux items
37Evaluer la qualité des échelles de Guttman
- Coefficient de reproductibilité (Goodenough) (cf.
exemple p. 5) - Coefficient de reproductibilite de Green
38(No Transcript)
39Evaluer la qualité des échelles de Guttman
- Coefficient théorique de reproductibilité
- Indice de consistance (I)
40Critiques
- Pas de métrique (les intervalles nont pas de
taille !) - Indices ne permettant pas linférence
- Surtout descriptif et attaché à un échantillon
observé - Travail fastidieux
41Modèles de la réponse à un item (MRI)
- La "Théorie de Réponse à un Item" émerge dans les
années 1950 et 1960 comme une réaction à la
théorie classique des tests. Contrairement à
cette dernière, la théorie de réponse à un item
n'est pas attachée aux scores obtenus à des tests
par des échantillons aléatoires, mais aux
réponses individuelles à des items particuliers.
Ces réponses sont modélisées comme le résultat
d'un processus stochastique dans lequel la
probabilité de donner une réponse d'un certain
type dépend de plusieurs paramètres. Ces
paramètres peuvent soit être liés aux personnes
(compétence), soit aux items (difficulté). (VAN
DER LINDEN, 1986, p. 329). - C'est généralement le terme anglais d'Item
Response Theory ou IRT qui est employé, même dans
certains textes français.
42Modèles de la réponse à un item (MRI)
1.00
Probabilité de réussite des items
Courbe caractéristique de l item x
Difficulté de l item
0.0
Compétence du sujet
Modèle général de Birnbaum
43Le modèle de Rasch
- La théorie développée par RASCH (1966) à propos
des items dichotomiques est en fait un cas
particulier de celle de BIRNBAUM (1968), au même
titre que les modèles de LAZARSFELD (1950) et
LAZARSFELD HENRY (1968) (LEVY, 1973).
44Autres modèles
Modèle de BIRNBAUM
Modèle de RASCH
Modèle de LAZARSFELD
Modèle de GUTTMAN
45Le modèle de Rasch
- RASCH postule qu'il a affaire à des items de même
pouvoir discriminatif, mais ayant un niveau de
difficulté distinct (LORD NOVICK, 1968, p.
402). - L'allure théorique de la distribution de
probabilité des réponses positives de chaque item
est déterminée par une fonction logistique (en
forme de S ou d'ogive). - Le seul paramètre à estimer dans ce modèle est la
valeur de l'abscisse du point d'inflexion de
chaque courbe. Dit plus simplement, le modèle
suppose que la distribution de probabilité des
réponses positives à chaque question peut
s'ajuster à une courbe théorique identique.
46Le modèle de Rasch
Probabilité de réussite des items
Courbe caractéristique de l item x
Difficulté de l item
Compétence du sujet
Modèle de Rasch (à 1 paramètre)
47Le modèle de Rasch
Ce modèle permet de mettre en relation l'aptitude
d'un sujet donné et la difficulté d'un
item par le biais de la différence
C'est cette différence qui
gouverne en fait la probabilité associée à
l'observation d'une réponse positive
48Le modèle de Rasch
Par définition, cette probabilité vaut 0,5
lorsque la différence entre la compétence d'un
sujet donné et la difficulté de l'item considéré
est nulle. Cette différence peut cependant varier
entre -? et ?. Les probabilités associées
tendent alors respectivement vers 0 et vers 1.
49Le modèle de Rasch
La probabilité qu'un sujet n obtienne une réponse
positive à l'item i, connaissant d'une part la
difficulté de l'item et d'autre part la
compétence du sujet s'exprime donc de la manière
suivante
50Le modèle de Rasch
51Le modèle de Rasch
52Le modèle à 3 paramètres
531e application pratique
Daprès Fagnant, 1996
541e application pratique
Daprès Fagnant, 1996
C 16
240,640
70
30,5x5152,5
90
55Résultats obtenus
- Représentation globale de léchelle (élèves et
items)
562e application pratique
La notion d ancrage
Une banque de questions contient typiquement des
items provenant de plusieurs tests qui ont été
calibrés lors d'administrations à des groupes
différents. Les paramètres de ces items doivent
alors être rapportés à une échelle commune. Cette
technique de mise en rapport implique une
procédure d'ancrage et de transformation. (VALE,
1986, p. 333) Un ancrage implique qu'une
personne en pratique, un ensemble de personnes
réponde aux items de plusieurs tests ou qu'un
item dans la pratique, un ensemble d'items soit
administré aux membres de plusieurs groupes.
(VALE, 1986, p. 335).
57(No Transcript)
58(No Transcript)
59(No Transcript)
60Critiques
- Nécessité dun logiciel de calcul
- Relativement aisé à interpréter (1 paramètre)
- Indépendance à léchantillon et au test
- Un seul continuum (sujets / items)
- Complexité de lajustement du modèle
- Encore peu utilisé dans le monde francophone
61(No Transcript)