Syntaxe: La prparation des donnes - PowerPoint PPT Presentation

1 / 26
About This Presentation
Title:

Syntaxe: La prparation des donnes

Description:

Cr ez un nouveau fichier, appelez l'ancien fichier: cyclismePSY6002_avant1_avecoutliersunivari s.sav ... fichier et appelez l'ancien cyclisme_avant2_avecoutliersmultivaries. ... – PowerPoint PPT presentation

Number of Views:75
Avg rating:3.0/5.0
Slides: 27
Provided by: genevive4
Category:

less

Transcript and Presenter's Notes

Title: Syntaxe: La prparation des donnes


1
Syntaxe La préparation des données
  • PSY6002_Cours 2

2
Lentrée de données et létendue
  • Létendue des items
  • Tous les scores sont-ils plausibles?
  • Quoi faire? Enlevez les scores impossibles et
    trouvez le vrai score (si possible).
  • Les recodes
  • Les computes

FREQUENCIES VARS varfi1 varfi2
varfi3 /statsall.
3
La préparation des données
  • Les items utilisés pour créer les variables
    représentant les sous-échelles peuvent maintenant
    être ignorés.
  • Utilisez et vérifiez seulement les variables à un
    item et les variables représentant les
    sous-échelles que vous avez créés avec les
    computes.

4
La préparation des données
  • Létendue des variables
  • Est-ce que létendue est suffisante?
  • Si seulement un ou deux scores sont endossés,
    vous avez un effet de plancher ou un effet de
    plafond.
  • Quoi faire?
  • Enlevez les variables problématiques
  • Rappelez-vous que les corrélations avec ces
    variables sont mal estimées
  • Les données manquantes
  • Les distributions de fréquences
  • Les scores extrêmes univariés et multivariés

5
Les données manquantes
  • Le nombre de données manquantes
  • Moins de 5 peu problématique
  • Sinon, cela limite la généralisation des
    résultats
  • Où se situent ces données manquantes?
  • Si les données manquantes sont distribuées de
    façon aléatoire peu problématique
  • Sinon, cela limite la généralisation des
    résultats
  • Analysez les données manquantes
  • Y a-t-il des différences entre ceux qui ont des
    données manquantes et les autres?

6
Quoi faire?
  • Enlevez les participants avec des données
    manquantes
  • Peu et distribués aléatoirement
  • (Pairwise ou analysis) versus listwise
  • Enlevez les variables problématiques
  • Peu et de moindre importance
  • Estimez les données manquantes
  • Moyenne de léchantillon ou de son groupe
    dappartenance (sil y a lieu)
  • Utilisez les données manquantes comme des données
    dintérêt
  • Créer une variable dichotomique (manquant vs non
    manquant)
  • Répétez les analyses avec et sans les personnes
    ayant des données manquantes
  • Pour le cours Vous pouvez ignorer vos données
    manquantes, mais expliquez létat de votre banque
    de données dans votre travail et interprétez vos
    résultats en conséquence.

7
Pour ceux et celles qui sont plus avancé(e)s 
Comment remplacer les données manquantes par la
moyenne
Recode varfi (missingxxxxxx).
Recode phar (missing4.82).
8
Pour ceux et celles qui sont plus avancé(e)s
Comment créer une variable dichotomique (manquant
vs non manquant)
Do if not missing (varfi). Compute nomvar
1. ELSE. Compute nomvar 2. END IF. Execute.
Do if not missing (abc). Compute misabc
1. ELSE. Compute misabc 2. END IF. Execute.
9
Les distributions de fréquences des variables
continues
  • Les scores de Skewness et Kurtosis devraient être
    entre 1 et -1.
  • Certains acceptent des skewness et kurtosis entre
    3 et -3 (voir Kline, 1998).
  • Revisez les postulats des analyses à chaque fois,
    certaines sont robustes.
  • Overall, univariate values of kurtoses and
    skewness were generally adequate, most values
    ranging from 1.0 to 1.0, with a mean skewness
    of .51 and a mean kurtosis of .23 (Muthén
    Kaplan, 1985)
  • ? Muthén, B., Kaplan, D. (1985). A
    comparison of methodologies for the factor
    analysis of non-normal Likert variables. British
    Journal of Mathematical and Statistical
    Psychology, 38, 171-189.
  • Réfléchissez à la distribution de vos données et
    tentez de comprendre.

10
Lhistogramme Les distributions de fréquences
GRAPH /HISTOGRAM(NORMAL)varfi .
GRAPH /HISTOGRAM(NORMAL)age .
11
Quoi faire?
  • Vérifiez vos scores extrêmes
  • Laissez tomber la variable problématique
  • Effectuez des transformations (voir TF, p. 86)
  • Attention! Certaines transformations ont pour
    effet dinverser vos scores (p.ex., 1/varfi).
  • Vérifier la distribution de la variable
    transformée, les transformations ne sont pas
    toujours efficaces.
  • Linterprétation des résultats devient plus
    difficile.

12
Les scores extrêmes univariés
  • Pour les variables dichotomiques, la taille des
    groupes ne devrait pas être plus différente
    quune proportion de 9010.
  • Examiner les scores z les scores extrêmes se
    situent au-delà et en deçà de /-3.29 (plt.001,
    test bilatéral).
  • Si léchantillon est très grand, on peut
    sattendre à en retrouver sans que cela soit
    problématique si la variable est normale.

Descriptives vars varfi /save. Frequencies
vars zvarfi.
13
Les scores Z
Moyenne
Fréquence
É-T
É-T
É-T
É-T
Scores
14
Quoi faire?
  • Enlevez les participants ayant des scores
    extrêmes.
  • Créez un nouveau fichier, appelez lancien
    fichier cyclismePSY6002_avant1_avecoutliersunivar
    iés.sav (Noubliez pas votre back up)
  • Pour ceux et celles qui sont plus avancé(e)s
    Remplacez les scores extrêmes par des scores
    situés à la limite de z /-3.29
  • Score limite moyenne /-3.29(écart-type)
  • Exemple Score limite 4.35 3.29(.91)
  • Exemple Score limite 7.34

Do if (varfi lt scorelimite). Compute varfi
scorelimite. End if. Execute.
15
Les scores extrêmes multivariés
Énergie
Négativité
Intelligence
16
Les scores extrêmes multivariés
  • Assurez-vous de vous occuper des scores extrêmes
    univariés avant.

regression vars id phar pobs sat vita etc
/statistics collin /dependent id /method
enter /residualsoutliers (mahal) id(id).
17
Les scores extrêmes multivariés
regression vars id phar pobs sat vita etc
/statistics collin /dependent id /method
enter /residualsoutliers (mahal) id(id).
18
Enlevez les scores extrêmes multivariés
  • Créez un autre fichier et appelez lancien
    cyclisme_avant2_avecoutliersmultivaries.sav
    (Noubliez pas de faire un back up) et enlevez
    les participants ayant des scores extrêmes de la
    banque de données à la main.
  • Lorsque les participants ayant des scores
    extrêmes ont été enlevés, refaites lanalyse. Il
    est courant que certains scores extrêmes soient
    masqués par les scores encore plus extrêmes.
  • Le nombre de variables doit être limité, sinon il
    y aura trop de scores extrêmes.
  • Si vous devez enlever plus de 5 de
    léchantillon, est-ce vraiment des scores
    extrêmes?
  • Pour les besoins du cours, incluez toutes vos
    variables et enlevez un maximum de 10
    participants ayant des scores extrêmes multivariés

19
Les sources daide
  • Notes de cours du professeur Cousineau
  • Disponible sur le site du cours
  • Manuel de SPSS
  • Pour trouver la commande et ses explications
  • spssbase.pdf
  • Disponible sur le site du cours

20
Fichier pdf, disponible sur le site du cours
21
Commande
Coisissez votre commande
Explication
22
(No Transcript)
23
Pour ceux et celles qui sont plus avancé(e)s
Comment filtrer des participants
FILTER BY variable.
FILTER OFF.
  • Les participants ayant un score de 0 sur la
    variable spécifiée seront exclus.
  • Attention à la commande select dans la syntax
    qui enlève vos données de façon permanente!

24
(No Transcript)
25
Pour ceux et celles qui sont plus avancé(e)s
Comment filtrer des participants
Do if (id xx) and (idxx). Compute nomvar
0. ELSE. Compute nomvar 1. END
IF. Execute. Filter by nomvar.
Do if not missing (abc). Compute misabc
1. ELSE. Compute misabc 0. END
IF. Execute. Filter by misabc.
26
Commande utile Vérification des données pour
chaque personne
list varfi varfi. execute.
list id abc. execute.
Note Lorsque le output est incomplet, cliquez
dessus pour pouvoir dérouler le texte et voir le
reste.
Write a Comment
User Comments (0)
About PowerShow.com