Title: Cap
1Capítulo 2
- DISTRIBUIÇÃO DE FREQUENCIA
2Representação tabular dos dados estatísticos
- Denomina-se tabela a disposição escrita dos
dados estatísticos segundo um ou mais critérios
de classificação. A seguir, um exemplo de tabela. - Tabela. Classe sócio-econômica das famílias do
Município X -
FONTE Prefeitura do Município X NOTA Dados
referentes ao mês de junho de cada ano (1)
Previsão realizada em novembro de 1998
3Elementos de uma tabela
- ELEMENTOS ESSENCIAIS
- Título é uma informação concisa colocada no topo
da tabela que indica a natureza do fato
observado, o local e a época em que procedeu-se a
observação. - Corpo é o conjunto de linhas e colunas que
contém uma série de informações em disposição
horizontal e vertical, respectivamente. - Casa ou célula é o cruzamento de uma linha com
uma coluna. Uma casa pode conter somente uma
informação. - Cabeçalho é a parte superior do corpo da tabela
que especifica o conteúdo das colunas. - Coluna indicadora é a parte do corpo da tabela
que especifica o conteúdo das linhas
4Elementos de uma tabela
- ELEMENTOS COMPLEMENTARES
- Fonte é a informação colocada no rodapé da
tabela destinada a indicar a procedência dos
dados. - Notas são informações destinadas a esclarecer
todo o conteúdo da tabela. No caso de haver duas
ou mais notas, estas devem ser numeradas por
algarismos romanos. - Chamadas são informações destinadas a esclarecer
o conteúdo de uma casa, linha ou coluna da
tabela. As chamadas são indicadas no corpo da
tabela por algarismos arábicos entre parênteses e
a numeração deve crescer da esquerda para a
direita e de cima para baixo. No corpo da tabela,
os números das chamadas devem estar esquerda nas
casas e à direita no cabeçalho e na coluna
indicadora.
5Distribuição de frequência
- É uma tabela constituída de uma coluna indicadora
que contem intervalos de dados e outra coluna que
contém o número de dados em cada intervalo. - Os intervalos são denominados classes e o número
de dados em cada classe é denominado freqüência
absoluta simples ou simplesmente freqüência,
geralmente denotada por f.
6Tabela- Nota final em Estatística dos alunos
da turma X, segundo
período de 2008
7Construção de uma tabela de distribuição de
frequências
Um número adequado de classes pode também ser
dado pela fórmula de Sturges que é a seguinte
(amostra) ou
(população)
onde n é o número de dados observados e logn é o
logaritmo decimal do número de dados. O
resultado encontrado pela fórmula acima deve ser
arredondado para o inteiro mais próximo. A
amplitude das classes é
8- OBS O limite da primeira classe deve ser igual
ou menor ao menor dado observado - Limite superior da última classe é igual ao
limite inferior da primeira somado ao produto do
número de classes pela amplitude das mesmas e
deve ser superior ao maior dado observado. - Exemplo. A quantidade de vendas de determinado
produto observada em 50 cidades, em julho de 2008
apresentou os seguintes dados - 110 110 112 121 125 128 128 131 131 132
136 141 142 142 145 145 147 147 147 150
150 150 151 153 155 157 159 159 159 163
163 165 165 165 165 165 165 168 171 173
175 175 176 179 184 185 189 193 195
197. - Elabore uma distribuição de freqüências para
estes dados.
9Distribuição de frequências relativas
- Comparar duas ou mais distribuições de
freqüências
(amostra)
(população)
10Distribuição de frequências acumuladas
- Número de dados até uma determinada classe,
incluindo todas as anteriores. - Para comparar duas ou mais distribuições de
freqüências acumuladas, empregam-se as
freqüências acumuladas relativas.
(amostra)
(população)
11Análise de uma distribuição de frequências
- Tendência central os dados se agrupam em torno
de um valor intermediário que tende a se
localizar no centro da distribuição. - Dispersão variação apresentada pelos dados.
Quanto maior for a variação, mais heterogêneos
são os dados quanto menor a dispersão, mais
homogêneos sãos os dados.
12Análise de uma distribuição de frequências
- Simetria numa distribuição simétrica os dados
estão igualmente distribuído em torno de um valor
central. - Conglomerados são grupos de dados que tendem a
se concentrarem em torno de certos valores
formando agrupamentos dentro da distribuição
denominados conglomerados. - Valores discrepantes são dados que se afastam
dos valores típicos.
13Capítulo 3
14GRÁFICO DE COLUNAS OU DE BARRAS
- É a representação de uma série estatística
através de retângulos em posição vertical
(gráfico de colunas) ou horizontal (gráfico de
barras). - Mais adequados para a representação de séries
geográficas e especificativas. - Os retângulos devem ter a mesma base e as
variações são representadas pelas alturas. - Quando as legendas são muito extensas, usa-se
gráfico de barras, com os retângulo em ordem
decrescente.
15Gráfico de colunas
16Gráfico de barras
17Colunas Justapostas e Colunas Superpostas
- Se houver mais de um item por categoria a ser
representada, as colunas (ou barras) podem ser
justapostas ou superpostas.
18Gráfico de colunas justapostas
19Gráfico de colunas superpostas
20Colunas compostas
- Neste caso, as colunas têm a mesma altura e são
dividas em áreas proporcionais aos itens de cada
categoria. Assim sendo, tem-se que - 1.º) Região Norte população urbana (59,0)
população rural (41) - 2.º) Região Nordeste população urbana (60,7)
população rural (39,3) - 3.º) Região Sudeste população urbana (88,0)
população rural (12,0) - 4.º) Região Sul população urbana (81,3)
população rural (18,7) - 5.º) Região Centro-Oeste população urbana
(75,6) população rural (24,4)
21Colunas compostas
22GRÁFICO DE SETORES
- É a representação de uma série estatística
através de um círculo dividido em setores cujas
áreas os proporcionais aos valores representados.
- Tem o objetivo de comparar os valores observados
numa série geográfica ou especificativa com o
total dos mesmos.
23GRÁFICO DE CURVAS OU DE LINHAS
- Utilizado quando uma das variáveis o tempo, sendo
este representado sempre no eixo das abscissas. - Havendo mais de uma variável a ser representada,
utiliza-se tracejados diferentes devidamente
identificados por meio de legendas.
Tabela 3.3. Precipitação e temperatura médias
anuais em Juiz de Fora, 1991-2000
Ano Precipitação (mm) Temperatura(ºC) Ano Precipitação (mm) Temperatura (ºC)
1991 1?544 18,7 1996 1?563 18,5
1992 1?648 19,8 1997 1?405 19,3
1993 1?221 19,4 1998 1?300 19,4
1994 1?730 19,1 1999 1?381 18,6
1995 1?565 19,4 2000 1?366 18,9
24Gráfico de Linhas
25Gráfico de Linhas
Populações dos municípios A e B, 1930-1990
Anos Habitantes Habitantes
Anos Município A Município B
1934........... 50 362 631 842
1950........... 112 549 1 374 509
1960........... 158 694 2 102 999
1970........... 222 172 3 091 408
1980........... 304 075 4 266 144
1990........... 420 038 5 631 310
2000........... 562 851 7 264 389
26GRÁFICO DE PONTOS
- Utilizado para representar a distribuição dos
dados de uma variável quantitativa quando o
número de observações não é muito grande. - Exemplo 3.5. Os dados abaixo referem-se às
medidas da temperatura média?(ºC) em 20 postos de
observação de determinada localidade em julho de
2001 19, 22, 18, 24, 16, 25, 18, 21, 20, 25, 19,
25, 18, 21, 20, 16, 19, 21, 14, 23. Represente
estes dados por um gráfico de pontos.
27Gráfico de Pontos
28HISTOGRAMA
- Utilizado para representar uma distribuição de
freqüências simples. - É um conjunto de retângulos justapostos de mesma
base que representam as classes sendo que as
alturas dos referidos retângulos correspondem às
freqüências (absolutas ou relativas) das
respectivas classes e os centros das bases
representam os pontos médios das respectivas
classes.
29Histograma
30POLÍGONO DE FREQUENCIA
- Também utilizado para representar um distribuição
de freqüência simples. - Representando-se os pontos médios das classes nas
abscissas e as respectivas freqüências no eixo
das ordenadas.
31OGIVA DE GALTON
- Utilizada para representar uma distribuição de
freqüências acumuladas. - Representando-se os limites das classes nas
abscissas e as respectivas freqüências acumuladas
no eixo das ordenadas
32Ogiva de Galton
33RAMOS E FOLHAS
- O gráfico de ramos e folhas é utilizado para
representar a distribuição dos dados de uma
variável quantitativa. - Exemplo 3.7. Os dados a seguir representam os
valores da vazão (em m3/s) de 26 rios na
localidade X em julho de 2001 56, 85, 42, 63,
97, 59, 72, 91, 95, 104, 68, 79, 88, 88, 101, 76,
100, 118, 86, 94, 93. Represente a distribuição
destes dados por um gráfico de ramos e folhas. - Solução
- Ordenando-se os dados acima, tem-se 42, 56, 59,
63, 68, 72, 76, 79, 85, 86, 88, 88, 91, 93, 94,
95, 97, 100, 101, 104, 118. - Adotando-se uma escala de 10, os ramos são 4, 5,
6, 7, 8, 9, 10 e 11, enquanto que as folhas são 2
(para o ramo 4), 6 e 9 (para o ramo 5), 3 e 8
(para o ramo 6), 2, 6 e 9 (para o ramo 7), 5, 6,
8 e 8 (para o ramo 8), 1, 3, 4, 5 e 7 (para o
ramo 9), 0, 1 e 4 (para o ramo 10) e 18 (para o
ramo 11). Com estas considerações, tem-se o
gráfico a seguir.
34Ramos e Folhas
35ANÁLISE DE UM GRÁFICO
- GRÁFICOS DE COLUNAS (BARRAS) SIMPLES E GRÁFICO DE
SETORES - Nestes gráficos deve-se observar os valores
máximo (s) e mínimo (s). Nos gráficos de colunas
justapostas, superpostas e compostas deve-se
comparar as variá eis envolvidas. - GRÁFICO DE CURVAS
- Nestes gráficos deve-se observar os valores
máximo (s) e mínimo (s), o (s) período (s) onde
ocorre (em) a(s) maior (es) e menor(es) variação
(variações) e a tendência das variáveis
analisadas. - No caso de duas ou mais variáveis, deve-se
comparar as variações das mesmas. - HISTOGRAMA, POLÍGONO DE FREQÜÊNCIA, OGIVA DE
GALTON, GRÁFICO DE PONTOS E RAMOS-E-FOLHAS - Nestes gráficos procura obter as seguintes
informações tendência central, dispersão e
assimetria, conglomerados e valores discrepantes.