R - PowerPoint PPT Presentation

About This Presentation
Title:

R

Description:

R Profa. Suzi camey_at_mat.ufrgs.br http://euler.mat.ufrgs.br/~camey/ – PowerPoint PPT presentation

Number of Views:47
Avg rating:3.0/5.0
Slides: 25
Provided by: Dep1150
Category:
Tags: bancos

less

Transcript and Presenter's Notes

Title: R


1
R
  • Profa. Suzi
  • camey_at_mat.ufrgs.br
  • http//euler.mat.ufrgs.br/camey/

2
Aula 02/05/08Maiores detalhes
http//leg.ufpr.br/paulojus/embrapa/Rembrapa/
  • Dados no R
  • Entrando com dados diretamento no R
  • Lendo dados de um arquivo texto
  • Importando dados de outros programas
  • Carregando dados já disponíveis no R
  • Acesso a planilhas e bancos de dados relacionais
  • Análise descritiva
  • Descrição univariada
  • Descrevendo o conjunto de dados milsa de Bussab
    Morettin
  • Uma demonstração de recursos grá?cos do R
  • Exercícios

3
Dados no R Entrando com dados diretamente no R
  • De?nindo vetores como já vimos!
  • gt a2 lt- c(23, 56, 34, 23, 12, 56) gt a3 lt- 110
    gt a4 lt- (110)  10 gt a5 lt- rep(3, 5)
    gt a6 lt- rep(c(5, 8), 3) gt a7 lt- rep(c(5, 8), eac
    h  3)

4
Dados no R Entrando com dados diretamente no R
  • Usando a função scan()
  • y lt- scan()   1 11   2 24   3 35
      4 29   5 39   6 47   7
      Read 6 items

5
Dados no R Entrando com dados diretamente no R
  • Usando a função edit()
  • a8 lt- edit(data.frame())

6
Dados no R Entrando com dados diretamente no R
  • Corrigindo e/ou alterando dados
  • gt y3 lt- 25
  • gt yy gt 30 lt- 30

7
Dados no R Lendo dados de um arquivo texto
  • Primeiro mudar o diretório.
  • gt ex01 lt- read.table("gam01.txt")
  • gt ex02 lt- read.table("exemplo02.txt", headT)
  • gt ex03 lt- read.table("dadosfic.csv", headT,
    sep"",dec",")
  • gt read.table("http//www.mat.ufrgs.br/camey/R/gam
    01.txt")

8
Dados no R Importando dados de outros programas
  • Primeiro carregar o pacote foreign
  • gt require(foreign)
  • read.dbf() para arquivos DBASE
  • read.epiinfo() para arquivos .REC do Epi-Info
  • read.mtp() para arquivos "Minitab Portable
    Worksheet"
  • read.S() para arquivos do S-PLUS restore.data()
    para "dumps"do S-PLUS
  • read.spss() para dados do SPSS
  • read.systat()
  • read.dta() para dados do STATA
  • read.octave() para dados do OCTAVE (um clone do
    MATLAB)
  • Para dados do SAS há ao menos duas alternativas
  • O pacote foreign disponibiliza read.xport() para
    ler do formato TRANSPORT do SAS e read.ssd() pode
    escrever dados permanentes do SAS (.ssd ou
    .sas7bdat) no formato TRANSPORT, se o SAS estiver
    disponível no seu sistema e depois usa
    internamente read.xport() para ler os dados no R.
  • O pacote Hmisc disponibiliza sas.get() que também
    requer o SAS no sistema.

9
Dados no R Carregando dados já disponíveis no R
  • O R disponibiliza diversos bancos de dados.
  • Para listá-los use os comandos
  • gtdata()
  • gtdata(pacote)
  • Exemplos
  • gt data(mtcars)
  • gt head(mtcars)
  • gt require(MASS)
  • gt data(topo)
  • gt head(topo)

10
Dados no R Acesso a planilhas e bancos de dados
relacionais
  • gt require(RODBC)
  • gt xlscon lt- odbcConnectExcel(Siga.xls)
  • gt dados1 lt- sqlFetch(xlscon,Plan1)
  • gt odbcClose(xlscon)
  • gt head(dados1)

11
Análise descritiva Descrevendo o conjunto de
dados milsa de Bussab Morettin
  • Dados
  • http//leg.ufpr.br/paulojus/embrapa/Rembrapa/Remb
    rapase9.htmlx10-530009.2
  • entrar com os dados
  • fazer uma análise descritiva

12
Análise descritiva Descrevendo o conjunto de
dados milsa de Bussab Morettin
  • Criar o banco
  • gt milsa lt- edit(data.frame())
  • gt milsa
  • Alterar o banco
  • gt fix(milsa)

13
Análise descritiva Descrevendo o conjunto de
dados milsa de Bussab Morettin
  •  Dar nome as categorias
  • gtmilsacivillt-factor(milsacivil,labelc("solteiro
    ","casado"),levels12)
  • gtmilsainstrucaolt-factor(milsainstrucao,labelc("
    1oGrau","2oGrau","Superior"),lev13,ordT)
  • gtmilsaregiaolt-factor(milsaregiao,labelc("capita
    l","interior","outro"),levc(2,1,3))
  • gt head(milsa)

14
Análise descritiva Descrevendo o conjunto de
dados milsa de Bussab Morettin
  •  Criar variáveis
  • gt milsalt-transform(milsa,idadeanomes/12)
  • ou
  • gt milsaidadelt-milsaanomilsames/12
  • Para simplificar a digitação
  • gt attach(milsa)

15
Análise descritiva Descrição univariada
  • Variável Qualitativa Nominal
  • gt civil
  • gt is.factor(civil)
  • gt civil.tblt-table(civil)
  • gt 100  table(civil)/length(civil)
  • gt prop.table(civil.tb)
  • gt pie(table(civil))
  • gt civil.molt-names(civil.tb)civil.tb  max(civil.
    tb)

16
Análise descritiva Descrição univariada
  • Variável Qualitativa Ordinal
  • gt instrucao
  • gt is.factor(instrucao)
  • gt instrucao.tb lt- table(instrucao)
  • gt prop.table(instrucao.tb)
  • gt barplot(instrucao.tb)
  • gt instrucao.molt-names(instrucao.tb)instrucao.tb
    max(instrucao.tb)
  • gt median(as.numeric(instrucao))
  • gt levels(milsainstrucao)median(as.numeric(milsa
    instrucao))

17
Análise descritiva Descrição univariada
  • Variável quantitativa discreta gráficos
  • gt filhos
  • gt is.factor(filhos)
  • gt is.numeric(filhos)
  • gt filhos.tb lt- table(filhos)
  • gt filhos.tbr lt- prop.table(filhos.tb)
  • gt plot(filhos.tb)
  • gt plot(filhos.tbr)
  • gt filhos.fac lt- cumsum(filhos.tbr)
  • gt plot(filhos.fac, type  "S")

18
Análise descritiva Descrição univariada
  • Variável quantitativa discreta medidas de
    locação
  • gt filhos.mo lt- names(filhos.tb)filhos.tb  max(f
    ilhos.tb)
  • gt filhos.md lt- median(filhos, na.rm  T)
  • gt filhos.me lt- mean(filhos, na.rm  T)
  • gt filhos.me lt- mean(filhos, trim  0.1, na.rm  T)
  • gt filhos.qt lt- quantile(filhos, na.rm  T)
  • trim0.1 elimina 10 das maiores e menores
    observações
  • na.rmT necessário pois existem missings

19
Análise descritiva Descrição univariada
  • Variável quantitativa discreta medidas de
    dispersão
  • gt range(filhos, na.rm  T)
  • gt filhos.A lt- diff(range(filhos, na.rm  T))
  • gt var(filhos, na.rm  T)
  • gt filhos.dp lt- sd(filhos, na.rm  T)
  • gt filhos.cv lt- 100  filhos.dp/filhos.me
  • gt filhos.qt lt- quantile(filhos, na.rm  T)
  • gt filhos.ai lt- filhos.qt4 - filhos.qt2
  • gt summary(filhos)

20
Análise descritiva Descrição univariada
  • Variável quantitativa Contínua
  • gt salario
  • gt is.factor(salario)
  • gt is.numeric(salario)
  • gt range(salario)
  • gt nclass.Sturges(salario)
  • gt args(cut)
  • gt args(cut.default)
  • gt salario.tb lt- table(cut(salario, seq(3.5, 23.5, 
    l  8)))
  • gt prop.table(salario.tb)

21
Análise descritiva Descrição univariada
  • Variável quantitativa Contínua gráficos
  • gt hist(salario)
  • gt boxplot(salario)
  • gt stem(salario)

22
Análise descritiva Descrição univariada
  • Variável quantitativa Contínua medidas de
    localização e dispersão
  • como no caso discreto

23
Análise descritiva Uma demonstração de recursos
grá?cos do R
  • gt demo(graphics)
  • gt file.show(system.file("demo/graphics.R",package
    "graphics"))  

24
Análise descritiva Exercícios
  • http//leg.ufpr.br/paulojus/embrapa/Rembrapa/Remb
    rapase9.htmlx10-660009.6
Write a Comment
User Comments (0)
About PowerShow.com