Title: Syntaxe: La prparation des donnes
1Syntaxe La préparation des données
2Lentrée de données et létendue
- Létendue des items
- Tous les scores sont-ils plausibles?
- Quoi faire? Enlevez les scores impossibles et
trouvez le vrai score (si possible). - Les recodes
- Les computes
FREQUENCIES VARS varfi1 varfi2
varfi3 /statsall.
3La préparation des données
- Les items utilisés pour créer les variables
représentant les sous-échelles peuvent maintenant
être ignorés. - Utilisez et vérifiez seulement les variables à un
item et les variables représentant les
sous-échelles que vous avez créés avec les
computes.
4La préparation des données
- Létendue des variables
- Est-ce que létendue est suffisante?
- Si seulement un ou deux scores sont endossés,
vous avez un effet de plancher ou un effet de
plafond. - Quoi faire?
- Enlevez les variables problématiques
- Rappelez-vous que les corrélations avec ces
variables sont mal estimées - Les données manquantes
- Les distributions de fréquences
- Les scores extrêmes univariés et multivariés
5Les données manquantes
- Le nombre de données manquantes
- Moins de 5 peu problématique
- Sinon, cela limite la généralisation des
résultats - Où se situent ces données manquantes?
- Si les données manquantes sont distribuées de
façon aléatoire peu problématique - Sinon, cela limite la généralisation des
résultats - Analysez les données manquantes
- Y a-t-il des différences entre ceux qui ont des
données manquantes et les autres?
6Quoi faire?
- Enlevez les participants avec des données
manquantes - Peu et distribués aléatoirement
- (Pairwise ou analysis) versus listwise
- Enlevez les variables problématiques
- Peu et de moindre importance
- Estimez les données manquantes
- Moyenne de léchantillon ou de son groupe
dappartenance (sil y a lieu) - Utilisez les données manquantes comme des données
dintérêt - Créer une variable dichotomique (manquant vs non
manquant) - Répétez les analyses avec et sans les personnes
ayant des données manquantes - Pour le cours Vous pouvez ignorer vos données
manquantes, mais expliquez létat de votre banque
de données dans votre travail et interprétez vos
résultats en conséquence.
7Pour ceux et celles qui sont plus avancé(e)s
Comment remplacer les données manquantes par la
moyenne
Recode varfi (missingxxxxxx).
Recode phar (missing4.82).
8Pour ceux et celles qui sont plus avancé(e)s
Comment créer une variable dichotomique (manquant
vs non manquant)
Do if not missing (varfi). Compute nomvar
1. ELSE. Compute nomvar 2. END IF. Execute.
Do if not missing (abc). Compute misabc
1. ELSE. Compute misabc 2. END IF. Execute.
9Les distributions de fréquences des variables
continues
- Les scores de Skewness et Kurtosis devraient être
entre 1 et -1. - Certains acceptent des skewness et kurtosis entre
3 et -3 (voir Kline, 1998). - Revisez les postulats des analyses à chaque fois,
certaines sont robustes. - Overall, univariate values of kurtoses and
skewness were generally adequate, most values
ranging from 1.0 to 1.0, with a mean skewness
of .51 and a mean kurtosis of .23 (Muthén
Kaplan, 1985) - ? Muthén, B., Kaplan, D. (1985). A
comparison of methodologies for the factor
analysis of non-normal Likert variables. British
Journal of Mathematical and Statistical
Psychology, 38, 171-189. - Réfléchissez à la distribution de vos données et
tentez de comprendre.
10Lhistogramme Les distributions de fréquences
GRAPH /HISTOGRAM(NORMAL)varfi .
GRAPH /HISTOGRAM(NORMAL)age .
11Quoi faire?
- Vérifiez vos scores extrêmes
- Laissez tomber la variable problématique
- Effectuez des transformations (voir TF, p. 86)
- Attention! Certaines transformations ont pour
effet dinverser vos scores (p.ex., 1/varfi). - Vérifier la distribution de la variable
transformée, les transformations ne sont pas
toujours efficaces. - Linterprétation des résultats devient plus
difficile.
12Les scores extrêmes univariés
- Pour les variables dichotomiques, la taille des
groupes ne devrait pas être plus différente
quune proportion de 9010. - Examiner les scores z les scores extrêmes se
situent au-delà et en deçà de /-3.29 (plt.001,
test bilatéral). - Si léchantillon est très grand, on peut
sattendre à en retrouver sans que cela soit
problématique si la variable est normale.
Descriptives vars varfi /save. Frequencies
vars zvarfi.
13Les scores Z
Moyenne
Fréquence
É-T
É-T
É-T
É-T
Scores
14Quoi faire?
- Enlevez les participants ayant des scores
extrêmes. - Créez un nouveau fichier, appelez lancien
fichier cyclismePSY6002_avant1_avecoutliersunivar
iés.sav (Noubliez pas votre back up) - Pour ceux et celles qui sont plus avancé(e)s
Remplacez les scores extrêmes par des scores
situés à la limite de z /-3.29 - Score limite moyenne /-3.29(écart-type)
- Exemple Score limite 4.35 3.29(.91)
- Exemple Score limite 7.34
Do if (varfi lt scorelimite). Compute varfi
scorelimite. End if. Execute.
15Les scores extrêmes multivariés
Énergie
Négativité
Intelligence
16Les scores extrêmes multivariés
- Assurez-vous de vous occuper des scores extrêmes
univariés avant.
regression vars id phar pobs sat vita etc
/statistics collin /dependent id /method
enter /residualsoutliers (mahal) id(id).
17Les scores extrêmes multivariés
regression vars id phar pobs sat vita etc
/statistics collin /dependent id /method
enter /residualsoutliers (mahal) id(id).
18Enlevez les scores extrêmes multivariés
- Créez un autre fichier et appelez lancien
cyclisme_avant2_avecoutliersmultivaries.sav
(Noubliez pas de faire un back up) et enlevez
les participants ayant des scores extrêmes de la
banque de données à la main. - Lorsque les participants ayant des scores
extrêmes ont été enlevés, refaites lanalyse. Il
est courant que certains scores extrêmes soient
masqués par les scores encore plus extrêmes. - Le nombre de variables doit être limité, sinon il
y aura trop de scores extrêmes. - Si vous devez enlever plus de 5 de
léchantillon, est-ce vraiment des scores
extrêmes? - Pour les besoins du cours, incluez toutes vos
variables et enlevez un maximum de 10
participants ayant des scores extrêmes multivariés
19Les sources daide
- Notes de cours du professeur Cousineau
- Disponible sur le site du cours
- Manuel de SPSS
- Pour trouver la commande et ses explications
- spssbase.pdf
- Disponible sur le site du cours
20Fichier pdf, disponible sur le site du cours
21Commande
Coisissez votre commande
Explication
22(No Transcript)
23Pour ceux et celles qui sont plus avancé(e)s
Comment filtrer des participants
FILTER BY variable.
FILTER OFF.
- Les participants ayant un score de 0 sur la
variable spécifiée seront exclus. - Attention à la commande select dans la syntax
qui enlève vos données de façon permanente!
24(No Transcript)
25Pour ceux et celles qui sont plus avancé(e)s
Comment filtrer des participants
Do if (id xx) and (idxx). Compute nomvar
0. ELSE. Compute nomvar 1. END
IF. Execute. Filter by nomvar.
Do if not missing (abc). Compute misabc
1. ELSE. Compute misabc 0. END
IF. Execute. Filter by misabc.
26Commande utile Vérification des données pour
chaque personne
list varfi varfi. execute.
list id abc. execute.
Note Lorsque le output est incomplet, cliquez
dessus pour pouvoir dérouler le texte et voir le
reste.