Title: Estat
1UNIVERSIDADE FEDERAL DE SANTA CATARINA Programa
de Pós-graduação em Odontologia
ESTATÍSTICA
Prof. Hubert Chamone Gesser, Dr. Graduação
em Administração - ESAG/UDESC Graduação em
Odontologia - UFSC Pós-graduação em Periodontia -
ABO/SC Especialização em Odontologia em Saúde
Coletiva - ABO/SC Doutorado e Mestrado em
Engenharia de Produção - UFSC
2 - SUMÁRIO -
Conceitos Básicos em Estatística
Intervalo de Confiança
Conhecendo os Dados
Probabilidades
Medidas de Tendência Central
Distribuição Binomial
Medidas de Ordenamento
Distribuição Normal
Medidas de Dispersão
Correlação
Amostragem
Testes de Associação
Tabelas e Gráficos
3 Conceitos Básicos em Estatística
Disciplina de Estatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
4ESTATÍSTICA
ESTATÍSTICA
Origem no latim status (estado)
isticum (contar) Informações referentes ao
estado Coleta, Organização, Descrição, Análise
e Interpretação de Dados
5ESTATÍSTICA
Recenseamentos Com o surgimento dos
Estados, aparece a necessidade de se contar o
povo (produção) e o exército (poder). Esforços
dos governos para conhecer seus habitantes, sua
condição socioeconômica, sua cultura, sua
religião, etc.
6ESTATÍSTICA
ASSOCIAÇÃO ENTRE ESTATÍSTICA E PESQUISAS
Pesquisas de Opinião Pública, Estudos
Mercadológicos, Estudos Epidemiológicos
(observacionais e experimentais) Gráficos e
médias publicados na mídia Análise de dados de
processos com variabilidade
7ESTATÍSTICA
O Que é Estatística?
Para Sir Ronald A. Fisher (1890-1962)
Estatística é o estudo das populações, das
variações e dos métodos de redução de dados.
8ESTATÍSTICA
O Que é Estatística?
- Eu gosto de pensar na Estatística como a
ciência de aprendizagem a partir dos dados...
Jon KettenringPresidente da American
Statistical Association, 1997
9ESTATÍSTICA
O Que é Estatística (definição)?
-
- Estatística é um conjunto de técnicas
e métodos que nos auxiliam no processo de tomada
de decisão na presença de incerteza.
10ESTATÍSTICA
LIVROS DE ESTATÍSTICA
11ESTATÍSTICA
- As diferenças são atribuídas a causas erradas
- As coincidências ocorrem frequentemente
- As pessoas tem dificuldades com probabilidades
- Acrescentam polimento às publicações
- Faz conhecer o grau de confiança das
conclusões.
12ESTATÍSTICA
As variabilidades mostram que existem diferenças
Alta Expectativa de Vida Boas Condições
Sanitárias Hábitos de Consumo Assistência em Saúde
Doenças Infecciosas Alta Mortalidade
Infantil Baixa Escolaridade Iniquidades em Saúde
Indicadores Sociais Diferentes
13ESTATÍSTICA
EXPECTATIVA DE VIDA Diferenças entre os países
14ESTATÍSTICA
IDH (Longevidade, Educação e Renda) em 2008
15ESTATÍSTICA
Coeficiente de GINI em 2009
16ESTATÍSTICA
RENDA PER CAPITA NO BRASIL (PNUD, 2000)
17ESTATÍSTICA
RENDA PER CAPITA EM SANTA CATARINA (PNUD, 2000)
18ESTATÍSTICA
ACESSO AO ENSINO SUPERIOR NO BRASIL (PNUD, 2000)
19ESTATÍSTICA
ACESSO AO ENSINO SUPERIOR EM SANTA CATARINA
(PNUD, 2000)
20ESTATÍSTICA
GRÁFICO DE DISPERSÃO - RENDA x EDUCAÇÃO (PNUD,
2000)
21ESTATÍSTICA
FONTES DEMOGRÁFICAS Bancos de Dados (OMS,
OPAS, MS, IBGE, etc) Indicadores Sociais (IDH,
GINI, QV) Pesquisas de Mercado (Hábitos de
Consumo) Censos Demográficos Pesquisa Nacional
por Amostra de Domicílios (PNAD) Programa das
Nações Unidas para o Desenvolvimento (PNUD)
22ESTATÍSTICA
POPULAÇÃO Conjunto de elementos que se
deseja estudar AMOSTRA Subconjunto da
população Nem sempre o Censo é viável (questões
econômicas) É mais barato coletar dados de
amostras
23ESTATÍSTICA
POPULAÇÃO Também chamada de Universo
AMOSTRA Parte da população
População
Amostra
24ESTATÍSTICA
POPULAÇÃO (N) Todos os estudantes
da UFSC AMOSTRA (n) Parte dos
estudantes da UFSC
Plano de Amostragem
25ESTATÍSTICA
REQUISITOS DE UMA AMOSTRA 1) Ter um tamanho
adequado (previamente calculado) Existem
fórmulas para o cálculo do adequado tamanho da
amostra 2) Constituintes selecionados ao acaso
(sorteio)
26ESTATÍSTICA
CLASSIFICAÇÃO DO TAMANHO DA
AMOSTRA Amostras Grandes n gt 100 Amostras
Médias n gt 30 (30 lt n lt 100) Amostras
Pequenas n lt 30 (12 lt n lt 30) Amostras
Muito Pequenas n lt 12 Observação As
amostras com n gt 30 geram melhores resultados.
O tamanho adequado deve ser
pré-calculado.
27ESTATÍSTICA
Áreas da Estatística
Amostragem e Planejamento de Experimentos (coleta
dos dados) Estatística Descritiva (organização,
apresentação e sintetização dos
dados) Estatística Inferencial (testes de
hipóteses, estimativas, probabilidades)
28ESTATÍSTICA
- Amostragem e Planejamento de Experimentos
- (coleta dos dados)
- - É o processo de escolha da amostra
- - É o início de qualquer estudo estatístico
- Consiste na escolha criteriosa dos elementos a
serem submetidos ao estudo - Exemplos Pesquisa sobre tendência de votação
- Cuidado Perfil da Amostra Perfil da
População
29ESTATÍSTICA
- Estatística Descritiva
- (organização, apresentação e sintetização dos
dados) - É a parte mais conhecida
- Diariamente veiculada na mídia (jornais,
televisão, rádio) - Distribuições de frequência, médias, tabelas,
gráficos - Exemplos de Analfabetos em uma comunidade
- Índice de Mortalidade Infantil (por mil
nascimentos) - Índice de Desenvolvimento Humano
30ESTATÍSTICA
Os Gráficos são Estatísticas Descritivas
31ESTATÍSTICA
- Declínio do Índice CPOD no Brasil
- (Hebiatras aos 12 anos de idade)
- ? CPOD de 6,65
- 1993 ? CPOD de 4,84
- 1996 ? CPOD de 3,06
- 2003 ? CPOD de 2,78
Os Índices são Estatísticas Descritivas
32ESTATÍSTICA
- Estatística Inferencial, Indutiva ou Analítica
- (testes de hipóteses, estimativas)
- Auxilia o processo de tomada de decisões
- Responde uma dúvida, compara grupos
- Testam-se 2 hipóteses (hipótese nula e hipótese
alternativa), sendo que uma delas será aceita
mediante a aplicação de um teste estatístico
baseado na teoria das probabilidades. - Exemplo O tabagismo está associado às doenças
pulmonares? - Hipóteses Nula (não há associação),
Alternativa (há associação)
33ESTATÍSTICA
EXERCÍCIO No 1 Em uma cidade de 500.000
habitantes onde 45 das pessoas têm título de
eleitor, realizou-se uma pesquisa eleitoral com
2000 pessoas. Qual é o tamanho da população de
estudo e o da amostra?
34ESTATÍSTICA
EXERCÍCIO No 2 Uma amostra de apenas 3000
eleitores pode fornecer um perfil confiável sobre
a preferência de todo o eleitorado, na véspera de
uma eleição presidencial? Por que?
35ESTATÍSTICA
EXERCÍCIO No 3 Você considera a pesquisa
proposta no exercício anterior como experimental
ou de levantamento? Por quê?
36ESTATÍSTICA
EXERCÍCIO No 4 Elabore uma situação em que
a estatística possa ser empregada em benefício de
uma organização de saúde.
37 Conhecendo os Dados
Disciplina de Estatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
38ESTATÍSTICA
TIPOS DE DADOS
-
- Dados Nominais (Sexo, Raça, Cor dos Olhos)
- Dados Ordinais (Grau de Satisfação)
- Dados Numéricos Contínuos (Altura, Peso)
- Dados Numéricos Discretos (Número de Filiais)
-
- Estatísticas aplicadas em alguns tipos de dados
- não podem ser aplicadas em outros .
39ESTATÍSTICA
TIPOS DE DADOS
-
- Dados Intervalares (Temperatura oC)
- Quando se referem a valores obtidos mediante a
aplicação de uma unidade de medida arbitrária,
porém constante e onde o zero é relativo. Este
tipo de dado tem restrições a cálculos. - 30oC não é três vezes mais quente que 10oC
- Para cálculos se utiliza a escala Kelvin
40ESTATÍSTICA
ARREDONDAMENTO DE DADOS CONTÍNUOS
1ª Regra Arredondar para o número mais próximo
2ª Regra Arredondar para o par mais
próximo 5,0 5,5 6,0 6,0 6,5 7,
0
41ESTATÍSTICA
EXERCÍCIO No 1 Faça os seguintes
arredondamentos 38,648 para o centésimo
mais próximo 38,65 54,76 para o
décimo mais próximo 54,8 27,465 para o
centésimo mais próximo 27,46 42,455 para o
centésimo mais próximo 42,46 4,5 para o inteiro
mais próximo 4
42ESTATÍSTICA
AGRUPAMENTO DE DADOS POR VALORES DISTINTOS
x f (frequência) 2 3 3 3 4 4
5 9 6 6 7 2 8 1 Total 28
8 2 5 6 5 6 5 4 3 7 5 6 5 4 7 2 5
4 6 5 3 6 5 4 2 5 3 6
43ESTATÍSTICA
AGRUPAMENTO DE DADOS POR CLASSES
Classes f (frequência) Ponto Médio 39
50 4 44,5 50 61 5 55,5 61
72 5 66,5 72 83 6 77,5 83
94 5 88,5
44ESTATÍSTICA
POLÍGONO DE FREQUÊNCIA
f
x f 2 3 3 3 4 4 5 9
6 6 7 2 8 1 Total 28
10 8 6 4 2
x
2 3 4 5 6 7 8
45ESTATÍSTICA
EXERCÍCIO No 2 Em uma amostra de estudantes
foram coletadas as seguintes alturas em metros
1,70 1,58 1,67 1,72 1,70 1,71 1,75 1,58
1,64 1,66 1,72 1,70 1,73 1,82 1,79 1,77
1,76 1,75 1,73 1,65 1,64 1,63 1,62 1,66
1,71 1,68 1,69 1,70 1,59 1,61 1,64 1,76
1,64 1,70 1,64 1,65 1,7 1,79 1,8 1,70
1,67 1,71 1,72 1,63 1,70 a) Qual foi o
tamanho da amostra (n)? b) Qual é a altura do
sujeito mais alto e a do mais baixo? c) Faça o
agrupamento de dados por valores distintos. d)
Faça o agrupamento por 6 classes.
46ESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Horizontal Análise Vertical
Assimétrica Positiva (esquerda)
Leptocúrtica (alta) Simétrica
Mesocúrtica Assimétrica Negativa (direita)
Platicúrtica (baixa) Análise
Conjunta Assimétrica Positiva Leptocúrtica
Simétrica Mesocúrtica Curva de Gauss Curva
Normal
47ESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Horizontal Assimétrica Positiva
(esquerda)
f
x
48ESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Horizontal Simétrica
f
x
49ESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Horizontal Assimétrica Negativa
(direita)
f
x
50ESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Vertical Leptocúrtica (alta)
f
x
51ESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Vertical Mesocúrtica
f
x
52ESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Vertical Platicúrtica (baixa)
f
x
53ESTATÍSTICA
DESCRIÇÃO DE DADOS NOMINAIS E ORDINAIS
Apresentam-se os valores absolutos e as
porcentagens Podem ser usadas tabelas ou
gráficos
Gráfico de Barras
Gráfico Circular
54ESTATÍSTICA
DESCRIÇÃO DE DADOS NOMINAIS E ORDINAIS
CUIDADO!!!
Gráfico de Linhas (não é usado, pois é restrito a
dados numéricos contínuos)
Gráfico de Barras Horizontal
55ESTATÍSTICA
DESCRIÇÃO DOS DADOS CONTÍNUOS
Trazem informações que expressam a tendência
central e a dispersão dos dados. Tendência
Central Média ( x ), Mediana ( Md ), Moda ( Mo
) Medidas de Dispersão Desvio Padrão,
Variância, Amplitude, Coeficiente de
Variação, Valor Máximo, Valor Mínimo
56ESTATÍSTICA
EXERCÍCIO No 3 Em uma pesquisa com jogadoras de
basquete foram coletados os seguintes pesos
corporais em quilogramas 65 66 62 66 63
61 67 63 64 62 68 67 65 64 65 66 63
64 65 66 64 63 64 66 65 63 64 65 64
63 64 63 64 68 69 70 a) Qual foi o tamanho
da amostra (n)? b) Qual é o maior peso e o
menor? c) Faça o agrupamento de dados por valores
distintos. d) Faça o agrupamento em 3 classes.
57 Medidas de Tendência Central
Disciplina de Estatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
58ESTATÍSTICA
MEDIDAS DE TENDÊNCIA CENTRAL
Nos dão uma idéia de onde se localiza o
centro, o ponto médio de um determinado conjunto
de dados. Medidas Média, Moda e Mediana.
f
x
59ESTATÍSTICA
MÉDIA
É um valor típico representativo de um conjunto
de dados. Fisicamente representa o ponto de
equilíbrio da distribuição. Modos de
calcular 1) para dados simples 2) para
valores distintos 3) para agrupamentos em classes
x S x / n
x S fx / n
x S fx / n
60ESTATÍSTICA
MÉDIA
1) Cálculo para dados simples
x S x / n S x Soma dos valores n tamanho
da amostra x (1618232117161920) 8
x 18,75
16 18 23 21 17 16 19 20
61ESTATÍSTICA
MÉDIA
2) Cálculo para valores distintos x f
fx 2 3 6 3 3
9 4 4 16 5 9
45 6 6 36 7 2
14 8 1 8 Total 28 134
x S fx / n S fx Soma dos produtos
dos valores distintos com a
frequência n tamanho da amostra x 134
x 4,7857 28
62ESTATÍSTICA
MÉDIA
3) Cálculo para agrupamentos em classes
Classes f x fx 39
50 4 44,5 178 50 61
5 55,5 277,5 61 72 5 66,5
332,5 72 83 6 77,5 465
83 94 5 88,5 442,5 Total
25 - 1695,5
x S fx / n S fx Soma dos produtos
dos valores distintos com a
frequência n tamanho da amostra x
1695,5 x 67,82 25
63ESTATÍSTICA
MEDIANA
É o valor que ocupa a posição central de um
conjunto de dados ordenados. Para um número par
de termos a mediana é obtida através da média
aritmética dos dois valores intermediários. Inter
pretação 50 dos valores estão abaixo ou
coincidem com a mediana e 50 estão acima ou
coincidem com a mediana.
64ESTATÍSTICA
MEDIANA
1) Cálculo da posição da mediana para dados
simples
PMd (n1) / 2 PMd (91) / 2 PMd 5o
Termo Mediana (Md) 6
2 3 4 5 6 7 8 9 10
65ESTATÍSTICA
MEDIANA
2) Cálculo da posição da mediana para valores
distintos x f fa 2
3 3o 3 3 6o 4
4 10o 5 9 19o 6
6 25o 7 2 27o 8
1 28o Total 28 -
PMd (n1) / 2 PMd (281) / 2 PMd 14,5 x
entre 14o e 15o Termo Mediana (Md) 5
66ESTATÍSTICA
MEDIANA
3) Cálculo da PMd para agrupamentos em classes
Classes f x fa
39 50 4 44,5 4o 50
61 5 55,5 9o 61 72 5
66,5 14o 72 83 6 77,5
20o 83 94 5 88,5 25o
Total 25 - -
PMd (n1) / 2 PMd (251) / 2 PMd 13o Termo
Classe Mediana 61 72 Mediana (Md) 66,5
(estimativa)
67ESTATÍSTICA
MEDIANA
3) Cálculo da PMd para agrupamentos em classes
Pode-se fazer a interpolação da classe mediana
Md Li ((PMd - faa) / f ) . A Li limite
inferior da classe mediana PMd posição da
mediana faa frequência acumulada da classe
anterior f frequência da classe mediana A
amplitude da classe mediana
Classe Mediana 61 72
68ESTATÍSTICA
MEDIANA
3) Cálculo da PMd para agrupamentos em classes
Interpolação da classe mediana
Md Li ((PMd - faa) / f ) . A Md 61
((13 - 9) / 5) . 11 Mediana
(Md) 69,8
Classe Mediana 61 72
69ESTATÍSTICA
MODA
É o valor que ocorre com maior frequência em um
conjunto de dados. Símbolo Mo
1) Moda para dados simples Exemplos 2, 3, 4,
5, 6, 7, 8 AMODAL 2, 3, 3,
4, 5, 6 ,7 MODA 3 2, 3, 3, 4, 5, 5,
6 BIMODAL (Mo 3 e Mo 5)
70ESTATÍSTICA
MODA
2) Moda para valores distintos x f
2 3 3 3 4
4 5 9 6 6 7
2 8 1 Total 28
O valor 5 tem o maior número de ocorrências
(9) Mo 5
71ESTATÍSTICA
MODA
3) Moda para agrupamentos em classes
Classes f x fa 39
50 4 44,5 4o 50 61 5
55,5 9o 61 72 5 66,5
14o 72 83 6 77,5 20o
83 94 5 88,5 25o Total
25 - -
Moda Bruta Ponto médio da classe de maior
frequência Mo 77,5 É uma estimativa
72ESTATÍSTICA
MODA
3) Moda para agrupamentos em classes
Moda de King Mo Li (A . f2 / (f1
f2)) Li limite inferior da classe modal A
amplitude do intervalo da classe modal f1
frequência da classe anterior a modal f2
frequência da classe posterior a modal
Mo 72 (11 . 5) 5 5
Mo 77,5
73ESTATÍSTICA
USO DAS MEDIDAS DE TENDÊNCIA CENTRAL
MÉDIA Dados Numéricos e Intervalares
É a medida mais utilizada. MODA Dados
Nominais MEDIANA Dados Ordinais
74ESTATÍSTICA
EXERCÍCIO No 1 Determine a média, a mediana e
a moda para o seguinte conjunto de dados
6 5 8 4 7 6 9 7 3
75ESTATÍSTICA
EXERCÍCIO No 2 Determine o menor valor, o
maior valor, a média, a mediana e a moda para o
seguinte conjunto de dados
12 32 54 17 82 99 51 11 44 22 22 33
44 52 76 41 37 10 5 87
76ESTATÍSTICA
EXERCÍCIO No 3 Dado o seguinte agrupamento em
classes determine
Classes f 1,60 1,65 10 1,65
1,70 15 1,70 1,75 22 1,75
1,80 18 1,80 1,85 3
Total 68
a) os pontos médios de cada classe b) a classe
modal c) a moda bruta d) a moda de King e) a
classe mediana f) a mediana por agrupamento de
classes g) a média por agrupamento de classes
77 Medidas de Ordenamento
Disciplina de Estatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
78ESTATÍSTICA
MEDIDAS DE ORDENAMENTO
São os valores que subdividem uma disposição em
rol Medidas QUARTIS, DECIS E PERCENTIS Os
Quartis dividem a disposição em 4 partes
iguais Q1, Q2, Q3 Os Decis dividem a disposição
em 10 partes iguais D1, D2, D3, D4, D5, D6, D7,
D8, D9 Os Percentis dividem a disposição em 100
partes iguais P1, P2, P3, P4, P5, P6, ... , P99
79ESTATÍSTICA
QUARTIS
Os Quartis dividem a disposição em 4 partes
iguais Q1, Q2, Q3 Entre cada quartil há 25 dos
dados da disposição Posição do Primeiro Quartil
(Q1) (n 1) / 4 Posição do Segundo Quartil
(Q2) 2.(n 1) / 4 Posição do Terceiro Quartil
(Q3) 3.(n 1) / 4 O segundo quartil coincide
com a Mediana (Q2 Md)
80ESTATÍSTICA
QUARTIS
Os Quartis dividem a disposição em 4 partes
iguais Q1, Q2, Q3 1, 1, 1, 2, 2, 2, 3, 3, 3, 4,
4, 4, 5, 5, 5, 5, 6, 7, 7, 7, 8, 8, 8, 8, 9, 9, 9
n 27
Q1
Q2
Q3
7o termo
14o termo
21o termo
81ESTATÍSTICA
DECIS
Os Decis dividem a disposição em 10 partes
iguais D1, D2, D3, D4, D5, D6, D7, D8, D9 Entre
cada decil há 10 dos dados da disposição Posição
do Primeiro Decil (D1) (n 1) / 10 Posição do
Segundo Decil (D2) 2.(n 1) / 10 Posição do
Nono Decil (D9) 9.(n 1) / 10 O Quinto Decil
coincide com a Mediana (D5 Md)
82ESTATÍSTICA
PERCENTIS
Os percentis dividem a disposição em 100 partes
iguais P1, P2, P3, P4, P5, P6, ... , P99 Entre
cada percentil há 1 dos dados da
disposição Posição do Primeiro Percentil (P1)
(n 1) / 100 Posição do Segundo Percentil (P2)
2.(n 1) / 100 Posição do Nonagésimo Nono
Percentil (P99) 99.(n 1) / 100 P50 Md
P25 Q1 P75 Q3
83ESTATÍSTICA
EXERCíCIOS
1) Dado o conjunto de dados a) apresente a
disposição em rol b) o Percentil 50, c) o
Primeiro Quartil, d) a Média, e) a Moda e f) a
Mediana
10 13 24 45 66 77 11 14
26 33 65 21 57
84ESTATÍSTICA
2) Em uma amostra com 2789 valores qual é a
posição do oitavo decil, da mediana, do segundo
decil, do terceiro quartil e do segundo quartil?
85ESTATÍSTICA
3) Determine a média, a moda, a mediana, o 1o
quartil, o 5o decil, o percentil 75 e o percentil
50 para a seguinte distribuição por valores
distintos?
Pesos (kg) f 64 4
65 10 66 12 67 12 68 15
69 14 70 9 71 5 72 2
86 Medidas de Dispersão
Disciplina de Estatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
87ESTATÍSTICA
DISPERSÃO DOS DADOS
É frequentemente chamada de variabilidade. Medidas
mais comuns Variância, Desvio Padrão, Amplitude
Dispersão dos dados na amostra
f
Dispersão dos dados na população
x
88ESTATÍSTICA
Dispersão na População
É uma forma de se ver o quanto os dados se
afastam da média. Exemplo Vilarejo com apenas 11
pessoas 135cm 152cm 136cm 152cm
138cm 157cm 141cm 163cm 143cm
170cm 152cm
Média 149cm Mediana e Moda 152cm Valor Máximo
170cm Valor Mínimo 135cm Amplitude 35cm
Alturas de 11 pessoas
89ESTATÍSTICA
Alturas (N11)
x - x (x - x)2 135cm 135-149 -14 196 136c
m 136-149 -13 169 138cm 138-149 -11 121 141c
m 141-149 -8 64 143cm 143-149 -6
36 152cm 152-149 3 9 152cm 152-149
3 9 152cm 152-149 3 9 157cm 157-149
8 64 163cm 163-149 14
196 170cm 170-149 21 441 Total
1314
Dispersão na População
- 2 Variância
- 1314 / 11
- 119,454 cm2
- s Desvio Padrão
- 119,454
- 10,92 cm
Soma dos desvios quadráticos
90ESTATÍSTICA
VARIÂNCIA E DESVIO PADRÃO NA POPULAÇÃO
Variância da população
s2 S ( x - x )2 / N
Desvio Padrão da população Raiz quadrada da
variância
s s2
Como a dispersão nas amostras é menor do que na
população, se faz um ajuste matemático.
91ESTATÍSTICA
VARIÂNCIA E DESVIO PADRÃO NA AMOSTRA
Variância da Amostra ( s2 ou v )
s2 S ( x - x )2 / ( n -1 )
Desvio Padrão da amostra ( s ou DP ) Raiz
quadrada da variância
s s2
A dispersão nas amostras é menor do que na
população, por isso é que se faz este ajuste
matemático
92ESTATÍSTICA
DESVIO PADRÃO
SIGNIFICADO É um modo de representar a dispersão
dos dados ao redor da média.
f
x
Média
93ESTATÍSTICA
DESVIO PADRÃO
A curva A mostra uma dispersão dos dados
maior do que a curva B, logo o desvio padrão de A
é maior do que o de B.
f
f
Curva A
Curva B
x
x
Média
Média
94ESTATÍSTICA
COEFICIENTE DE VARIAÇÃO
O desvio padrão depende da unidade de medida
usada, assim um desvio medido em dias será maior
do que um medido em meses. O coeficiente de
variação expressa o desvio-padrão como
porcentagem do valor da média. COEF.
VARIAÇÃO 100 . DESVIO PADRÃO
MÉDIA Quanto menor for este coeficiente mais
homogênea é a amostra.
95ESTATÍSTICA
COEFICIENTE DE VARIAÇÃO
Classificação da proporção que o desvio padrão
apresenta sobre a média. GRAU DE HOMOGENEIDADE
DOS DADOS até 10
? ÓTIMO de 10 a 20 ? BOM
de 20 a 30 ? REGULAR acima de 30
? RUIM
96ESTATÍSTICA
EXERCÍCIOS
1) Determine a média, a amplitude, a variância,
o desvio padrão e o coeficiente de variação da
seguinte amostra de dados
4 5 5 6 6 7 7 8
97ESTATÍSTICA
2) Determine o valor de n, a amplitude, a
média, o desvio padrão e o coeficiente de
variação da seguinte amostra de dados
22 32 45 22 46 76 24 21 78 43 21 58
92 11 16 28 33 73 11 29 22 47 28 24
21 53 36 88 99 18
98ESTATÍSTICA
3) Com base nos coeficientes de variação
calculados nos dois exercícios anteriores
classifique a dispersão encontrada
99 Amostragem
Disciplina de Estatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
100ESTATÍSTICA
APLICAÇÕES DE AMOSTRAGEM
Pesquisa Mercadológica (Índice de satisfação na
população) Pesquisa Epidemiológica (Prevalência
de uma doença na população) Pesquisa Eleitoral
(Percentagem de votos para cada candidato) Perfil
Socioeconômico da População (Grau de
escolaridade, Renda)
Na População Parâmetros Na Amostra
Estatísticas
População
Amostra
Inferência Estatística
101ESTATÍSTICA
POR QUE USAR A AMOSTRAGEM?
Economia (É mais barato levantar dados de uma
parcela da população) Tempo (É mais
rápido) Confiabilidade dos Dados (Entrevista
mais atenciosa, menos erros) Operacionalidade
(Facilidade de controle dos entrevistadores) Qu
ando a população for pequena (n gt 0,8.N) Quando
a característica for de fácil mensuração (Sim ou
Não) Quando houver a necessidade de alta
precisão (Censo IBGE)
QUANDO NÃO USAR A AMOSTRAGEM?
102ESTATÍSTICA
TIPOS DE AMOSTRAGEM
AMOSTRAGEM ALEATÓRIA SIMPLES (Tem que obedecer
a propriedade de qualquer elemento da população
ter a mesma chance de pertencer à amostra.
Pode-se utilizar uma tabela de números aleatórios
ou sorteios) AMOSTRAGEM ALEATÓRIA
SISTEMÁTICA (Após obter-se a lista dos elementos
da população, sorteia-se a entrada e segue-se a
relação N/n.) AMOSTRAGEM ALEATÓRIA
ESTRATIFICADA (Elabora-se a amostra através do
perfil conhecido da população. Exemplo Se na
UFSC 70 são alunos e 30 Funcionários, a amostra
é confeccionada obedecendo-se estes parâmetros.)
103ESTATÍSTICA
OUTROS TIPOS DE AMOSTRAGEM
AMOSTRAGEM NÃO ALEATÓRIA (De fácil
obtenção.) AMOSTRAGEM PARA ESTUDOS
COMPARATIVOS (Não visa a descrição de uma
população, mas a comparação entre grupos
diferentes. Exemplos Comparar as taxas de
tabagismo em indivíduos com câncer de pulmão e
sadios.)
Procure respeitar o Plano de Amostragem para que
seja alcançada uma amostra representativa da
população.
104ESTATÍSTICA
DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
Fórmula Genérica Sejam n0 Primeira
aproximação para o tamanho da amostra e
Erro Amostral Tolerável (exemplo 0,05)
n Tamanho da Amostra N Tamanho da
População
n0 1 / e2
n (N . n0) / (N no)
105ESTATÍSTICA
DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
Fórmula para variável quantitativa, desvio
conhecido e população infinita Sejam n
Tamanho da Amostra z Nível
de confiança expresso em desvio padrão (95)
1,96 s Desvio padrão da
população e Erro do estudo expresso na
mesma unidade do desvio padrão
n (z . s /e)2
106ESTATÍSTICA
DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
Fórmula para variável quantitativa, desvio
desconhecido e população infinita Sejam n
Tamanho da Amostra z Nível
de confiança expresso em desvio padrão (95)
1,96 s Desvio padrão de uma
amostra previamente selecionada e Erro do
estudo expresso na mesma unidade do desvio
padrão
n (z . s/e)2
107ESTATÍSTICA
DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
Fórmula para variável quantitativa, desvio
conhecido e população finita Sejam n
Tamanho da Amostra z Nível
de confiança expresso em desvio padrão (95)
1,96 s Desvio padrão
população e Erro do estudo expresso na
mesma unidade do desvio padrão N Tamanho
da População
n z2 . s 2 . N z2
. s 2 e2 . (N-1)
108ESTATÍSTICA
DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
Fórmula para variável quantitativa, desvio
desconhecido e população finita Sejam n
Tamanho da Amostra z Nível
de confiança expresso em desvio padrão (95)
1,96 s Desvio padrão uma
amostra previamente selecionada e Erro do
estudo expresso na mesma unidade do desvio
padrão N Tamanho da
população
n z2 . s2 . N z2 .
s2 e2 . (N-1)
109ESTATÍSTICA
DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
Populações infinitas com proporção conhecida
z2 . p . (1-p))
e2
n
Onde n Tamanho da Amostra z Nível de
confiança expresso em desvio padrão (95)
1,96 e Erro Amostral Tolerável expresso em
proporção (exemplo 0,05) p Proporção do
evento na População (prevalência de uma doença)
110ESTATÍSTICA
DETERMINAÇÃO DO TAMANHO DA AMOSTRA (n)
Populações finitas com proporção conhecida
(N . z2 . p . (1-p))
(e2 . (N-1) z2 . p . (1-p))
n
Onde n Tamanho da amostra N
Tamanho da População z Nível de confiança
expresso em desvio padrão (95) 1,96 e Erro
Amostral Tolerável expresso em proporção
(exemplo 0,05) p Proporção do evento na
População (prevalência de uma doença)
111ESTATÍSTICA
RELAÇÃO ENTRE (n) E (N)
Relação entre o tamanho da população e o tamanho
da amostra
n
600 500 400 300 200 100 0
N
0 500 1000 1500 2000
2500 3000 3500
112ESTATÍSTICA
EXERCÍCIOS
1) Determine o tamanho da amostra para uma
pesquisa eleitoral em uma cidade com 200.000
eleitores, adotando uma margem de erro de 2
pontos percentuais. Utilize a fórmula genérica.
113ESTATÍSTICA
2) Determine o tamanho da amostra para um
pesquisa epidemiológica sobre a prevalência da
doença periodontal em adultos jovens numa cidade
com 3452 jovens, adotando-se o nível de confiança
de 95 (z1,96) e o erro amostral tolerável de
4. Estudos anteriores indicavam que a
prevalência desta doença, nesta mesma população
era de 86. Estima-se ainda que 10 das pessoas
poderiam se recusar em participar da pesquisa.
114 Tabelas e Gráficos
Disciplina de Estatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
115ESTATÍSTICA
TABELAS
Tabela é a forma não discursiva de apresentar
informações, das quais o dado numérico se destaca
como informação central. Uma tabela estatística
conterá necessariamente uma série ou uma
distribuição de frequência. Vantagens -
Permitem a síntese dos resultados - Auxiliam o
pesquisador na análise dos dados e - Facilitam a
compreensão das conclusões do autor.
116ESTATÍSTICA
NORMAS PARA A CONFECÇÃO DE TABELAS
São numeradas consecutivamente com algarismos
arábicos Os números são precedidos da palavra
Tabela No topo deve estar o título que indica
a natureza e as abrangências geográficas e
temporal dos dados numéricos O centro da tabela
é representado por uma série de colunas e
subcolunas onde são alocados os dados No rodapé
deve-se colocar a fonte (o responsável pelos
dados) e opcionalmente uma nota geral ou uma nota
específica A moldura deve conter no mínimo 3
traços horizontais Não se deve fechar uma tabela
com traços verticais em suas extremidades.
117ESTATÍSTICA
CLASSIFICAÇÃO DAS TABELAS
Séries Cronológicas (temporais ou
históricas) Variável Tempo Constantes Lugar e
Espécie Séries Geográficas (territoriais) Variáv
el Lugar Constantes Tempo e Espécie Séries
Especificativas Variável Espécie Constantes
Tempo e Lugar Séries Mistas Quando há mais de
uma variável. Distribuição de Frequência
118ESTATÍSTICA
Séries Cronológicas (Temporais ou Históricas)
Tabela 1 Prevalência da Doença X na Cidade Y
Anos Percentual 1999 25,74 2000
26,85 2001 27,94 2002 32,45 Fonte
Hipotética
119ESTATÍSTICA
Séries Geográficas (Territoriais)
Tabela 2 Prevalência da Doença X no Ano de 2003
Cidades Percentual Itajaí 10,44 La
ges 29,45 Florianópolis 8,66 Blumenau
9,82 Fonte Hipotética
120ESTATÍSTICA
Séries Especificativas
Tabela 3 Prevalência da Doença X no Ano de 2003
em Florianópolis
Segmento populacional
Percentual Crianças 60,25 Jovens
20,72 Adulto 2,75 3a Idade
5,82 Fonte Hipotética
121ESTATÍSTICA
Séries Mistas (Ex Especificativa-Cronológica-Geo
gráfica)
Tabela 4 Vendas de alguns produtos por ano e
cidade (milhares)
Produtos 2001 2002
Fpolis Lages Fpolis Lages Cosméticos
24,24 9,34 25,95
9.98 Vestuário 112,72 27,45
111,75 29,48 Audio 86,75
18,45 79,37 19,57 Video
1,95 0,85 2,01 0,84
Fonte Hipotética
122ESTATÍSTICA
Distribuições de Frequência
Tabela 5 Distribuição de frequência dos pesos
corporais de uma amostra (valores em quilogramas)
Pesos Frequência Frequência Acumulada
64 51 51 65 100 151
66 22 173 67 14
187 Total 187 - Fonte
Hipotética
123ESTATÍSTICA
GRÁFICOS
Gráfico é a forma geométrica de apresentação dos
dados e respectivos resultados de sua análise. A
escolha do modelo ideal de representação gráfica
depende das preferências e do senso estético do
elaborador. Vantagens - Permitem a síntese
dos resultados - Auxiliam o pesquisador na
análise dos dados e - Facilitam a
compreensão das conclusões do autor.
124ESTATÍSTICA
NORMAS PARA A CONFECÇÃO DE GRÁFICOS
Deve facilitar a interpretação dos dados para um
leigo Não há a necessidade de se colocar título
se estiver na mesma página da tabela
correspondente Há a necessidade de se colocar o
título se a tabela correspondente não estiver na
mesma página. O senso estético individual
determina o espaço do gráfico (L x A) As
colunas, barras, linhas e áreas gráficas devem
ser ordenadas de modo crescente ou decrescente,
mas a ordem cronológica prevalece
125ESTATÍSTICA
ORIGEM DOS GRÁFICOS
O diagrama cartesiano é a figura geométrica
que deu origem à técnica de construção de
gráficos estatísticos. Utiliza-se o
primeiro quadrante do sistema de eixos
coordenados cartesianos ortogonais.
Ordenadas (eixo y)
1o Quadrante
Abscissas (eixo x)
Eixo y Frequências Eixo x Valores
da Variável
126ESTATÍSTICA
GRÁFICO EM COLUNAS OU DE BARRAS
Tabela 1 Quantidade de exames realizados em um
determinado laboratório em 2003.
Exames Quantidade
Hematologia 9824
Bioquímica 21534
Imunologia 15432
Parasitologia 4310 Fonte
Hipotética
Figura 1 Gráfico em colunas do número de exames
em um determinado laboratório em 2003.
127ESTATÍSTICA
GRÁFICO DE BARRAS HORIZONTAL
Tabela 2 Quantidade de exames realizados em um
determinado laboratório em 2003.
Exames Quantidade
Hematologia 9824
Bioquímica 21534
Imunologia 15432
Parasitologia 4310 Fonte
Hipotética
Figura 2 Gráfico em barras horizontais do
número de exames realizados em um determinado
laboratório no ano de 2003.
128ESTATÍSTICA
GRÁFICO DE SETORES OU CIRCULAR
Tabela 3 Quantidade de exames realizados em um
determinado laboratório em 2003.
Exames Quantidade
Hematologia 9824
Bioquímica 21534
Imunologia 15432
Parasitologia 4310 Fonte
Hipotética
Figura 3 Gráfico circular do número de exames
realizados em um determinado laboratório no ano
de 2003.
129ESTATÍSTICA
HISTOGRAMA DE FREQUÊNCIA
Tabela 4 Notas dos alunos na disciplina de
Estatística no curso de Administração (ano x)
Notas Frequência
0 2
2 2 4
7 4 6
11 6 8
10 8 10
5 Fonte Dados Fictícios
Figura 4 Histograma das notas dos alunos
130ESTATÍSTICA
HISTOGRAMA DE FREQUÊNCIA
- A área do histograma é proporcional à soma das
frequências - Para comparar duas distribuições, o ideal é
utilizar números percentuais
Figura 5 Histograma dos percentuais das notas
dos alunos
131ESTATÍSTICA
POLÍGONO DE FREQUÊNCIA
- É um Gráfico em Linha de uma distribuição de
frequência - Para se obter um polígono (linha fechada),
deve-se completar a figura, ligando os extremos
da linha obtida aos pontos médios da classe
anterior à primeira e posterior à última, da
distribuição.
Figura 6 Polígono de Frequência percentual de
das notas dos alunos
132ESTATÍSTICA
POLÍGONO DE FREQUÊNCIAS ACUMULADAS
(Sinônimo Ogiva)
Tabela 5 Notas dos alunos na disciplina de
estatística no ano x Notas
Frequência F. Acumulada 0 2
2 5,7 2 4
7 25,7 4 6
11 57,1 6 8 10
85,7 8 10 5
100,0 Fonte Dados Fictícios
Figura 7 Polígono de frequências acumuladas
das notas dos alunos
133ESTATÍSTICA
GRÁFICO STEM AND LEAF (TRONCO E FOLHAS)
Tronco (Stem) Folha (Leaf)
1 3455 2 2389 3 356799
4 57 5 37889 6 235
7 12
13 14 15 15 22 23 28 29 33 35 36 37 39
39 45 47 53 57 58 58 59 62 63 65 71 72
Figura 8 Gráfico Stem-Leaf onde o primeiro
dígito é o tronco e o segundo é a folha
Conjunto de Dados
134ESTATÍSTICA
GRÁFICO DE BARRAS COM DESVIO PADRÃO
Figura 9 Gráfico de barras com os valores
médios e o desvio padrão das alturas de
estudantes da faculdade x (valores fictícios).
135ESTATÍSTICA
GRÁFICO BOX AND WISKER (Caixa e Fio de Bigode)
1,95m 1,90m 1,85m 1,80m 1,75m 1,70m 1,65m 1,60m 1,
55m
Valor Máximo
Percentil 75
Percentil 50
Percentil 25
Valor Mínimo
Figura 10 Gráfico Box and Wisker das alturas
dos estudantes de medicina (valores fictícios).
136ESTATÍSTICA
EXERCÍCIOS
1) Construa uma série cronológica com os dados
das vendas de um determinado produto de uma
empresa fictícia.
137ESTATÍSTICA
2) Construa o Gráfico de Barras com os dados do
exercício anterior.
138ESTATÍSTICA
3) Construa o Gráfico em Setores do seguinte
agrupamento em classes
- Pesos (Kg) f
- 60 15
- 80 26
- 100 38
- 120 9
- Total 88
139 Intervalo de Confiança
Disciplina de Estatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
140ESTATÍSTICA
POPULAÇÃO E AMOSTRA
x
x
x
Média
x
x
x
População
Amostras
141ESTATÍSTICA
POPULAÇÃO E AMOSTRA
f
Distribuição da população
Distribuição das médias de amostras de mesmo
tamanho extraídas da população
x
x
142ESTATÍSTICA
POPULAÇÃO E AMOSTRA
A média calculada para uma amostra dificilmente
será igual à média real da população O tamanho
da discrepância depende do tamanho da amostra e
da variabilidade dos dados.
Discrepância Inversamente proporcional a
n Diretamente proporcional à variabilidade dos
dados
f
x
Média a
Média b
143ESTATÍSTICA
ERRO PADRÃO DAS MÉDIAS
f
O desvio padrão da distribuição das médias é
chamado ERRO PADRÃO DAS MÉDIAS (EPM)
x
x
144ESTATÍSTICA
ERRO PADRÃO DAS MÉDIAS
CÁLCULO DO ERRO PADRÃO DAS MÉDIAS (EPM) EPM
s / n
f
Mede a dispersão das médias das diferentes
amostras de mesmo tamanho, extraídas da mesma
população, em torno da média das médias, isto é,
em torno da média verdadeira da população
estudada.
x
x
145ESTATÍSTICA
CÁLCULO DO ERRO-PADRÃO A PARTIR DE UMA AMOSTRA
COM 10 PESOS
- Variância (s2)
- 1074 / (10-1)
- 119,333 Kg2
- Desvio Padrão (s)
- 119,333
- 10,924 Kg
- Erro Padrão (EPM)
- 10,924 / 10
- 3,45 Kg
Pesos (n10) x - x
(x - x)2 20Kg 20-36 -16 256 23Kg
23-36 -13 169 24Kg 24-36 -12 144 36Kg
36-36 0 0 37Kg 37-36 1
1 38Kg 38-36 2 4 39Kg
39-36 3 9 43Kg 43-36 7
49 45Kg 45-36 9
81 55Kg 55-36 19 361 Total
1074
146ESTATÍSTICA
INTERVALO DE CONFIANÇA (Amostras Grandes)
Mostra o intervalo em que se situa a média real
da população Comumente se adota um intervalo com
95 de confiança (z1,96) O tamanho da amostra
deve ser razoavelmente grande (ngt30).
Limite Inferior IC(95) x - 1,96 . EPM Limite
Superior IC(95) x 1,96 . EPM
147ESTATÍSTICA
INTERVALO DE CONFIANÇA (Amostras Pequenas)
Comumente se adota um intervalo com 95 de
confiança O valor de t (Distribuição t de
Student) varia conforme o tamanho da amostra (gl
n-1) Possibilita o cálculo para amostras
pequenas (nlt30).
f
Limite Inferior IC(95) x - t . EPM Limite
Superior IC(95) x t . EPM
Distribuição t de Student
Média a
Média b
x
148ESTATÍSTICA
COMPARAÇÃO DE DISTRIBUIÇÕES
Amostras Pequenas Valor de t é variável (t 1,96
a 12,706) 95 de Confiança
Amostras Grandes Valor de z é constante (z
1,96) 95 de Confiança
f
Média a
Média b
x
Distribuição t de Student
Distribuição Normal
149ESTATÍSTICA
INTERVALO DE CONFIANÇA
INTERPRETAÇÃO Se forem extraídas 100 amostras
de mesmo tamanho da população, 95 delas estarão
situadas dentro do intervalo e 5 não Um
intervalo de confiança muito grande sugere que a
média da amostra encontrada é pouco
representativa da média (verdadeira) da
população O erro padrão da média mostra o quão
bem a média é conhecida, assim quanto menor for o
EPM menor será o IC.
150ESTATÍSTICA
INTERVALO DE CONFIANÇA
EXEMPLO Em uma amostra de 300 estudantes do
sexo masculino da faculdade Z, verificou-se que a
média das alturas era de 1,75m. Sabendo que o
desvio-padrão da amostra era de 10cm, determine o
intervalo de confiança para a média das alturas
desta população. EPM s / n
IC(95) x - 1,96 . EPM 175 - 1,96 .
0,5773 173,87cm EPM 10 / 300
IC(95) x 1,96 . EPM 175 1,96 . 0,5773
176,13cm EPM 0,5773cm 1,7387m
1,7613m
151ESTATÍSTICA
COMPARAÇÃO ENTRE INTERVALOS DE CONFIANÇA
IC (95) Faculdade Z
1,7387m 1,7613m x
1,75m IC (95) IES X
1,71m 1,75m x 1,73m
Conclusão As médias populacionais não devem ser
consideradas diferentes.
152ESTATÍSTICA
COMPARAÇÃO ENTRE INTERVALOS DE CONFIANÇA
IC (95) Faculdade Z
1,7387m 1,7613m x
1,75m IC (95) IES Y 1,726m
1,734m x 1,73m Conclusão As médias
populacionais PODEM ser consideradas diferentes.
153ESTATÍSTICA
EXERCÍCIOS
1) Quando se compara duas médias amostrais
oriundas de populações distintas, pode-se dizer
que as populações são diferentes quando as médias
amostrais são diferentes?
154ESTATÍSTICA
2) Um hospital A verificou que os pacientes
internados tinham um prazo médio de recuperação
para uma determinada doença mensurado em torno de
10 dias e desvio padrão de 1 dia. Outra amostra
de pacientes do Hospital B, internados com a
mesma doença apresentou como média 12 dias e
desvio padrão de 2,5 dias. Sabendo que a primeira
amostra continha 70 pacientes e a segunda 90
pergunta-se Há diferença entre as duas
populações com relação ao tempo necessário de
recuperação?
155 Probabilidades
Disciplina de Estatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
156ESTATÍSTICA
MODELOS PROBABILÍSTICOS
Os modelos probabilísticos são construídos a
partir de hipóteses ou conjeturas sobre o
problema em questão e constituem-se de duas
partes ( 1 ) dos possíveis
resultados ( 2 ) do quão provável é
cada resultado.
Exemplo Lançamento de uma moeda
Possíveis resultados ? cara, coroa
Probabilidade de ocorrer cara é igual a de
ocorrer coroa
157ESTATÍSTICA
ESPAÇO AMOSTRAL
É o conjunto de todos os resultados possíveis de
um experimento. O espaço amostral é representado
pelo símbolo ?
Lançamento de uma moeda
Possíveis resultados ? ? cara, coroa
Lançamento de um dado Possíveis
resultados ? ? 1, 2, 3, 4, 5, 6
158ESTATÍSTICA
EVENTO
É qualquer conjunto de resultados possíveis de um
experimento.
Lançamento de um dado Possíveis resultados ? ?
1, 2, 3, 4, 5, 6 EVENTOS A ocorrer um
número par ? A 2, 4, 6 B ocorrer um
número menor que 3 ? B 1, 2 C ocorrer o
ponto seis ? C 6 D ocorrer um ponto
maior que seis ? D
159ESTATÍSTICA
PROBABILIDADES
São valores entre 0 (zero) e 1 (um), onde a soma
de todos os resultados possíveis do experimento
deve ser igual a 1 (um).
Modelos Probabilísticos ? no lançamento de uma
moeda Resultado Probabilidade Cara
0,5 Coroa 0,5 ? na retirada de
uma bola de uma urna com 7 bolas vermelhas e 3
azuis Resultado Probabilidade
Bola Vermelha 0,7 Bola Azul
0,3
160ESTATÍSTICA
PROBABILIDADES
Princípio da Equiprobabilidade
P (A) n número de resultados de
A N número total de
resultados
Exemplo no lançamento de um dado A ocorrer
um número par P(A) 3/6 ½ 0,5 B
ocorrer um número menor que 3 P(B) 2/6
1/3 0,333 C ocorrer o ponto 6 P(C)
1/6 0,166 D ocorrer um ponto maior que 6
P(D) 0/6 0
161ESTATÍSTICA
PROBABILIDADES
Somatório de Probabilidades Individuais
P (A) P (B) ? Adição
Exemplo Uma urna tem 5 bolas brancas, 3
vermelhas e 2 pretas. Seleciona-se uma bola ao
acaso. Qual a probabilidade dela ser branca ou
vermelha?
P (A) P (B) 5/10 3/10 8/10 0,8
162ESTATÍSTICA
PROBABILIDADES
Eventos Independentes
P (A) . P (B) ? Multiplicação
Quando a probabilidade da ocorrência de um evento
não altera a ocorrência de um outro. Exemplo
Em dois lançamentos de um dado, os eventos A
(número par no 1o lançamento) e B (número ímpar
no 2o lançamento) são independentes, haja vista
que a ocorrência de um nada tem a ver com a
ocorrência de outro. Qual é a probabilidade de A
e B ocorrerem seguidamente?
P (A) . P (B) ½ . ½ ¼ 0,25
163ESTATÍSTICA
EXERCÍCIOS
1) Determine o espaço amostral das seguintes
situações (a) Numa urna com bolas azuis e
vermelhas, extrair uma bola e observar sua cor.
(b) Num certo bairro, indagar a uma família se
ela costuma fazer compras no supermercado Alfa.
(c) Num certo bairro, selecionar uma amostra
de 10 famílias e indagar quantas delas fazem
compras no supermercado Alfa. (d) Numa escola
de primeiro grau, selecionar uma criança e medir
a sua altura.
164ESTATÍSTICA
2) Numa sala com 10 homens e 20 mulheres,
sorteia-se um indivíduo, observando o sexo.
Construa o modelo probabilístico.
165ESTATÍSTICA
3) Numa determinada cidade 20 da população é
constituída por descendentes de europeus e 35
por descendentes de japoneses. (a) Construa o
modelo probabilístico e (b) determine qual é a
probabilidade de se sortear um indivíduo
pertencente a uma das duas descendências?
166 Distribuição Binomial
Disciplina de Estatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
167ESTATÍSTICA
EXPERIMENTO BINOMIAL
Estuda o comportamento amostral de eventos
dicotômicos. Masculino / Feminino Satisfeito
/ Insatisfeito Atrasado / Não-atrasado Estes
eventos são denominados designativos (sim /
não ou sucesso / fracasso)
168ESTATÍSTICA
EXPERIMENTO BINOMIAL
Tem as seguintes características ( 1 ) consiste
de n ensaios ( 2 ) cada ensaio tem apenas dois
resultados sim ou não ( 3 ) os ensaios são
independentes entre si, com probabilidade ? de
ocorrer sim, sendo ? uma constante entre 0 e 1.
Exemplo Lançamento de uma moeda 3 vezes e
observar o número de caras. n 3 ?
0,5
169ESTATÍSTICA
EXPERIMENTO BINOMIAL
Cálculo Probabilístico P (r) n!
. pr . (1 - p)n-r r!
. (n - r)! n número de tentativas ou
repetições do experimento r proporção desejada
de sucessos n-r proporção esperada de
fracassos p probabilidade de sucessos
170ESTATÍSTICA
EXPERIMENTO BINOMIAL
Exemplo A probabilidade de nascimento de um
menino ou de uma menina é de 50 ou 1/2. Quais
são as probabilidades em uma família de seis
filhos de ter 0, 1, 2, 3, 4, 5 e 6 crianças do
sexo masculino? ( 1 ) consiste de n ensaios (6
tentativas de se ter um menino) ( 2 ) cada
ensaio tem apenas dois resultados possíveis
(menino ou menina) ( 3 ) os ensaios são
independentes entre si, com probabilidade
? (probabilidade de se ter menino em cada
tentativa ? 0,5)
171ESTATÍSTICA
Exemplo A probabilidade de nascimento de um
menino ou de uma menina é de 50 ou 1/2. Quais
são as probabilidades em uma família de seis
filhos de ter 0, 1, 2, 3, 4, 5 e 6 crianças do
sexo masculino? Para que não se tenha
meninos P (r) n! . pr . (1
- p)n-r r! . (n - r)! P
(0) 6! . 0,50 . (1 - 0,5)6-0
0! . (6 - 0)! P (0)
1/64 ou 0,0156 ( 1,56 para 0 meninos e 6
meninas)
172ESTATÍSTICA
Exemplo A probabilidade de nascimento de um
menino ou de uma menina é de 50 ou 1/2. Quais
são as probabilidades em uma família de seis
filhos de ter 0, 1, 2, 3, 4, 5 e 6 crianças do
sexo masculino? Para que se tenha um menino P
(r) n! . pr . (1 - p)n-r
r! . (n - r)! P (1)
6! . 0,51 . (1 - 0,5)6-1
1! . (6 - 1)! P (1) 6/64 ou
0,0938 ( 9,38 para 1 menino e 5 meninas)
173ESTATÍSTICA
EXERCÍCIOS
1) Calcule as distribuições de probabilidades do
exemplo anterior para que ocorram (a) 2
meninos (b) 3 meninos (c) 4 meninos (d)
5 meninos e (e) 6 meninos
174 Distribuição Normal
Disciplina de Estatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
175ESTATÍSTICA
DISTRIBUIÇÃO BINOMIAL x DISTRIBUIÇÃO NORMAL
y
Média, Moda e Mediana
x
Média, Moda e Mediana
Distribuição Binomial
Distribuição Normal
176ESTATÍSTICA
DISTRIBUIÇÃO BINOMIAL x DISTRIBUIÇÃO NORMAL
Média, Moda e Mediana
Variável dicotômica (sim ou não, sucesso ou
fracasso) Dá para enumerar os possíveis
resultados
Variável contínua (infinitos resultados
possíveis) Não dá para enumerar os possíveis
resultados
177ESTATÍSTICA
CURVA NORMAL
- É descrita pela média e pelo desvio padrão.
- A mediana, a média e a moda coincidem.
- A curva é simétrica ao redor da média.
- A curva é mesocúrtica.
Média, Moda e Mediana
178ESTATÍSTICA
CURVA NORMAL
- As inferências em pesquisas em administração
estão baseadas em dados, cuja distribuição é
normal. - A curva normal (Gauss) é simétrica, unimodal e
tem forma de sino. - É assintótica em relação ao eixo horizontal
(eixo x).
Média, Moda e Mediana
179ESTATÍSTICA
A ESTATÍSTICA Z
- A estatística Z (standard score) está baseada na
curva normal. - Mede o afastamento de um valor em relação a
média em unidades de desvios padrão. - Z x - x
- s
180ESTATÍSTICA
A ESTATÍSTICA Z
y
- Exemplo
- A altura média dos estudantes da UFSC é de 1,70m
com desvio padrão de 10cm - Z x - x
- s
x
160
180
150
140
190
200
170
z
0
-1
1
-2
2
3
-3
181ESTATÍSTICA
ÁREAS DA CURVA NORMAL
Áreas -1DP a 1DP ? 68,27 -2DP a 2DP
? 95,45 -3DP a 3DP ? 99,73 -1,96DP a
1,96DP ? 95 Média a 1DP ? 34,13 Média a 2
DP ? 47,72 Média a 3DP ? 49,86
182ESTATÍSTICA
ÁREAS DA CURVA NORMAL
34,13
47,72
49,86
183ESTATÍSTICA
ÁREAS DA CURVA NORMAL
68,27
95,45
99,73
184ESTATÍSTICA
EXERCÍCIOS
1) O processo de fabricação de uma determinada
empresa apresenta a média de peso de uma peça
igual a 100g e desvio padrão de 1,5 g. Qual é a
proporção de peças entre 100 e 102g?
Z (x - média) / desvio padrão (102 - 100) /
1,5 1,33 na tabela qdo z 1,33 a área é de
50 - 9,18 40,82
?
100 102
x
0 ?
z
185ESTATÍSTICA
2) Calcule as seguintes proporções de
peças (a) com peso entre 98 e 102g (b)
abaixo de 98g (c) acima de 102g (d) abaixo de
100g (e) abaixo de 95g
186 Correlação
Disciplina de Estatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
187ESTATÍSTICA
DIAGRAMA DE DISPERSÃO
Mostra o comportamento de duas variáveis
quantitativas (com dados numéricos).
a
a
a
b
b
b
188ESTATÍSTICA
CORRELAÇÃO LINEAR POSITIVA
Quando valores pequenos da variável a tendem a
estar relacionados com valores pequenos de b,
enquanto que valores grandes de a tendem a estar
relacionados com valores grandes de b.
a
Exemplos Peso x Altura Nível socioeconômico x
Volume de vendas Consumo de Álcool x Preval.
Cirrose Hepática
b
189ESTATÍSTICA
CORRELAÇÃO LINEAR NEGATIVA
Quando valores pequenos da variável a tendem a
estar relacionados com valores grandes de b,
enquanto que valores grandes de a tendem a estar
relacionados com valores pequenos de b.
a
Exemplos Renda Familiar x Número de
Filhos Escolaridade x Absenteísmo Volume de
vendas x Passivo circulante
b
190ESTATÍSTICA
CORRELAÇÃO NÃO LINEAR
O diagrama de dispersão mostra um conjunto de
pontos aproximando-se mais de uma parábola do que
de uma reta.
a
Exemplos Coef. de Letalidade (a) x Dose do
Medicamento (b) Custo (a) x Lote Econômico de
Compra (b)
b
191ESTATÍSTICA
r n . ? (X.Y) - ? X . ? Y
n . ? X2 - (? X)2 . n . ? Y2 - (?
Y)2 ?(X.Y) Fazem-se os produtos X.Y p/ cada
par e depois efetua-se a soma ?X Somatório dos
valores da variável X ?Y Somatório dos valores
da variável Y ?X2 Elevam-se ao quadrado cada
valor de X e depois efetua-se a soma ?Y2
Elevam-se ao quadrado cada valor de Y e depois
efetua-se a soma
192ESTATÍSTICA
Cálculo do coeficiente de correlação para os
dados das variáveis X população residente e Y
taxa de cresc. populacional, em 12 vilarejos.
X Y X2 Y2 X . Y 101 3,2
10201 10,24 323,2 193 4,6 37249 21,16 887,8
. . . .