Title: Kein Folientitel
1Ecole Supérieure de la Statistique et de
lAnalyse de lInformation de Tunisie
Initialisation au logiciel SAS (Statistical
Analysis System)
Slim ZOUAOUI Slim_zouaoui_at_essai.rnu.tn
2Introduction
SAS est un logiciel
de gestion et danalyse statistique de grande
puissance .
généraliste .
multi plateforme (il est écrit en C).
traite un nombre quasiment illimité de données.
contient une importante bibliothèque de
fonctions prédéfinit qui sont disponibles dans un
ensemble de modules.
Introduction
3Un programme SAS
Il se compose de deux types d'instructions
Etape DATA (pour données)
- saisie et manipulation des données sous SAS.
- créer différents jeux de données et des
nouvelles variables .
Etape Proc (pour procédure)
- Effectuer des opérations sur les tables.
- Etudier et analyser les données.
4TP 1
- Création dune table SAS à partir dun fichier
texte.
- Saisie des données sous SAS.
- Les contrôleurs de pointeur.
- Création d'un fichier permanent.
- Lecture d'un fichier de données en format SAS.
Etape DATA
5Création dune table SAS à partir dun fichier
texte
DATA nom du table infile chemain du
fichier_en_entrée input variables Proc
print Run
Etape DATA
6Saisie des données sous SAS
DATA nom du table input variables Cards
. .données... . Proc
print Run
Etape DATA
7Les contrôleurs de pointeur
- _at_n déplace le pointeur à la colonne n
spécifiée.
- n déplace le pointeur à n colonnes vers la
droite.
- / déplace le pointeur à la ligne suivante.
- n déplace le pointeur à la ligne n spécifiée.
- _N_ n éme étapes du block DATA.
- _at_ rester sur la ligne de données courante
pour le prochain énoncé INPUT .
A la fin de lénoncé Input
- _at__at_ rester sur la ligne courante pour des
exécutions futures du bloc DATA.
Etape DATA
8Création dun fichier permanent
LIBNAME nom_librairie trajectoire_librairie
DATA nom_librairie.non_du_table INFILE
chemin du fichier INPUT variables RUN
Proc print Run
Etape DATA
9Lecture d'un fichier de données en format SAS
LIBNAME nom_librairie trajectoire_librairie
DATA nom du table SET nom_librairie.non_du_t
able RUN Proc print Run
Etape DATA
10Création d'un fichier de données ASCII à partir
d'un fichier SAS
DATA _NULL_ SET nom_librairie.nom_du_table FIL
E ' chemin du fichier texte ' PUT variables
RUN
Etape DATA
11Concaténation verticale et horizontale de
fichiers
DATA nom du table SET table1 table2
RUN Proc print Run
DATA nom du table SET table 1 SET table 2
RUN Proc print Run
Etape DATA
12Création d'un fichier à partir d'un
sous-ensemble de variables
Keep, drop pour garder ou supprimer une
variable des données
DATA Exemple1(Keepvariables)
Exemple2(Dropvariables) SET non_du_table
RUN Proc print Run
Etape DATA
13Traitement des données
- Créer une nouvelle variable nouv_variable
formule appropriée
- IF/THEN/ELSE IF condition THEN énoncé
- Else énoncé
- DELETE pour éliminer certaines observations
d'un fichier SAS.
- DO permet de répéter un certain nombre de fois
un bloc d'instructions -
- DO variablevaleur1 TO valeur2 BY pas
- énoncés
- END
Etape DATA
14Etape Proc (pour procédure)
- Effectuer des opérations sur les tables.
- Etudier et analyser les données.
Etape PROC
15Proc contents
donne les attributs, les formats et les labels
des tables et des bibliothèques SAS.
proc contents datanom_du_table run
Etape PROC
16Proc print
imprimer les observations dune table SAS.
proc print ltoptionsgt run ltoptionsgt DATAno
m_du_table Id variables BY variables SUM
variables LABEL étiquettes NOOBS
Etape PROC
17Proc printto
permet de rediriger dans un fichier le contenu de
la fenêtre OUTPUT et/ou celui de la fenêtre LOG.
proc printto print chemain_du_fichier.out
log chemain_du_fichier.log
ltoptiongt run ltoptionsgt new
Etape PROC
18Proc sort
trie une table SAS suivant une ou plusieurs
variables.
proc sort datanom_du_table outfichier_de
sortie By ltdescendinggt variable (s) run
Etape PROC
19Proc means
procure des outils de calcul de statistiques
élémentaires pour les variables numériques.
proc means ltoptionsgt ltmots-clés_statistiques
gt run ltoptionsgt by variable (s)
class variable (s) var variable (s)
Etape PROC
20Proc univariate
permet dobtenir un nombre plus important de
statistiques
Proc univariate ltoptionsgt run
ltoptionsgt by variable (s) var variable (s)
id variables
Etape PROC
21Proc rank
ordonne les variables, calcule les rangs et les
scores.
proc rank datanom_du_table outfichier_de
sortie var variable (s) ranks nom (s)
by variable (s) run
Etape PROC
22Proc freq
Cette procédure produit des tableaux de
fréquences unidimensionnelles ou des tris croisés
multidimensionnels.
Proc freq ltoptionsgt run ltoptionsgt
by variable (s) tables variable (s)
Etape PROC
23Proc standard
permet de normaliser les valeurs de quelques-unes
ou de toutes les variables d'un jeu de données
SAS.
Proc standard ltoptionsgt run
ltoptionsgt by variable freq variable var
variable
Etape PROC
24Proc corr
permet de calculer des corrélations entre les
variables numériques.
Proc corr ltoptionsgt run ltoptionsgt
var variable (s) with variable (s) partial
variable By variable
Etape PROC
25Proc freq
Produire le tableau de contingence, profil ligne
et profil colonne pour les deux variables
qualitatives .
Proc freq Tables var1var2 run
Etape PROC
26Proc reg
Étudier la liaison entre la production et le
capital en mettant en œuvre une régression
linéaire simple.
Proc reg Model var1var2 run
Etape PROC
27Proc anova
Étudier le modèle de lanalyse de la variance
Proc anova Class var_qual Model var_quant
var_qual run
Etape PROC
28Proc chart
produit en mode caractère des histogrammes
horizontaux et verticaux, des histogrammes en
bloc, des diagrammes circulaires et en étoiles.
Proc chart ltoptionsgt run ltoptionsgt
block variable (s) by variable (s) Vbar
variable (s) Hbar variable (s) Pie variable
(s)
Etape PROC
29Proc plot
tracer en mode caractère une ou plusieurs courbes
sur un même graphique.
Proc plot ltoptionsgt Plot
var_verticalevar_horizontale /option run
ltoptionsgt data non du table /option By
variable (s)
Etape PROC
30SAS/GRAPH
permet d'obtenir sur périphériques graphiques des
sorties simples et complexes à plusieurs
dimensions. Il permet également la modification
interactive des graphiques grâce à un éditeur
graphique.
31Proc gplot
représente sous forme de courbe une variable en
fonction d'une autre et peut tracer plusieurs
courbes dans un même système d'axes.
Proc gplot Plot var_verticalevar_horizontale
run
32Proc gchart
produit des histogrammes horizontaux et
verticaux, des diagrammes circulaires, en étoiles
et diagrammes en blocs.
Proc gchart ltoptionsgt run
ltoptionsgt block variable (s) by variable
(s) Vbar variable (s) Hbar variable (s) Pie
variable (s)
33Proc gchart
Tracer un histogramme et qqplot
Proc univariate Var variable Histogram /
normal (muest sigmaest) qqplot / normal
(muest sigmaest) Run
34Proc G3D
représente trois variables dans un repère à trois
dimensions.
Proc G3D Plot var1 var2 var3 Scatter
var1 var2 var3 run
35Analyse des données avec SAS
36Analyse en Composantes Principales (ACP)
PROC PRINCOMP DATA tab1 OUT tab2
OUTSTAT tab3 N VAR variables
RUN PROC PLOT
DATA tab2 PLOT axe2axe1age RUN
Etape PROC
37Analyse Factorielle des Correspondances (AFC)
PROC CORRESP DATAtab1 OUTC tab2
VAR modalités ID var_qual RUN PROC
PLOT DATA tab2 PLOT dim2dim1
var_qual RUN
Etape PROC
38 Etape PROC