Title: ESTAD
1ESTADÍSTICA DESCRIPTIVA
2COMPETENCIAS Y OBJETIVOS
- UNIDAD I ESTADISTICA DESCRIPTIVA
- Competencia
- -El estudiante debe utilizar correctamente los
procedimientos ,técnicas y métodos
estadísticos,en el tratamiento y procesamiento de
datos de todo trabajo de investigación científica - Objetivos.
- -Aplicar adecuadamente las técnicas y
procedimientos estadísticos como metodología de
toda investigación principalmente en la
Ingeniería. - Descripción general de la unidad
- -Esta unidad comprende el desarrollo de los
siguientes aspectos ciclo metodológico de la
investigación estadística, recopilación.
organización ,clasificación y descripción de
datos de una muestra aleatoria o población
determinación y utilización de las medidas
descriptivas. - LecturaMillar/Freund/Jonson
Probabilidad y Estadística para
IngenierosEdo.de México 1992 Pgs.1 al 40 - Córdova Zamora
Estadística Descriptiva e Inferencial 2ª
ed.Perú 1996 Pags,1 al 69 - Bibliografía Básica García Oré
(1995) Estadística descriptiva y
Probabilidades(2ª ed) Perú .Pags.2al 83 - Referencia electrónica
http//thales.cica.es/red/Recursos/rd99/ed99-0278-
01/inicio.html
3 Estadística Descriptiva
CONTENIDO MÍNIMO 1.-INTRODUCCIÓN A LA
ESTADÍSTICA(muestreo) 2.-ORGANIZACIÓN Y
CLASIFICACIÓN DE DATOS 3.-MEDIDAS DE
POSICIÓN 4.-MEDIDAS DE DISPERSIÓN 5.-REGRESIÓN
LINEAL SIMPLE
4Introducción a la Estadística
- 1.-DEFINICIÓN.- Como ciencia proporciona un
conjunto de métodos,técnicas y/o procedimientos
,para recopilar,organizar,presentar ,analizar
datos,con el fin de realizar generalizaciones
válidas,para tomar decisiones coherentes,ante la
incertidumbre,acerca de la población o sus
parámetros a partir de datos extraídos de una
muestra. - ESTADÍSTICA DESCRIPTIVA.
- ESTADÍSTICA INFERENCIAL
5- POBLACIÓN (N).-Conjunto universo,motivo de
análisis que tiene por lo menos alguna
característica en común,el proceso para obtener
toda la información de la población se llama
censo - PARÁMETRO.- Es un nº resumen que sintetiza
alguna característica de la población - MUESTRA (n).- Es un subconjunto propio
representativo de la población,el proceso para la
obtención de los datos muestrales se llama
muestreo - ESTADÍGRAFO.-Es un nº sintético que resume
alguna característica de la muestra
61.- INTRODUCCIÓN AL MUESTREO
- PROCESO DEL DESARROLLO CIENTÍFICO
DESARROLLO DEL CONOCIMIENTO
MÉTODO CIENTÍFICO
7 PERFIL DE TESIS
- TÍTULO
- JUSTIFICACIÓN
- FORMULACIÓN DEL PROBLEMA
- HIPÓTESIS
- OBJETIVOS
- METODOLOGÍA
- MÉTODOS inductivo,deductivo,hidtórico,ló
gico,experimental etc. - .TÉCNICAS DE RECOLECCIÓN DE datos
(muesreo) - DE PROCESAMIENTO DE
DATOS(Estadística Inferencial) - INSTRUMENTOS SOFTWARE ESTADÍSTICO)
- MARCO TEÓRICO Y REFERENCIAL
- ESQUEMA TENTATIVO DE LA TÉSIS O PROYECTO DE
GRADO - ANEXOS
- BIBLIOGRAFÍA
8- Metodología de la investigación
- 1.-Planteamiento del problema y de la hipótesis
- Se define claramente los objetivos del
estudio,se toma una m.a. cuyos datos se utilizan
para la inferencia sobre el modelo asignado ó
contrastando valores para sus parámetros - 2.-Recolección de datos
- a)Datos publicados,b)diseño experimental
c)Encuesta - 3.-Organización y clasificación de datos
- se debe realizar un análisis de consistencia
- 4.-Análisis e interpretación de los datos
D E S C R I P T I V A
9- METODOLOGIA DE LA INVESTIGACIÓN
- 5.-Realización de Inferencia
- PRUEBAS PARAMÉTRICAS .-representar la
incertidumbre asociada a la característica en
cuestión ,a un modelo probabilístico cuyos
parámetros se desconocen - Estimación de los estadísiticos
- a) Puntual ,b) Por Intervalos de Confianza
- 6.-Realizar el TEST DE HIPóTESIS
- Contrastar la validez de algún supuesto
- acerca de los valores de los parámetros ó
- de la Distribución del modelo ,(por IC ó de
Siginificancia,y el P value),ó predecir. -
I N F R E N C I A
101.2.- Tipos de Muestreo
- Muestreo.- herramienta fundamental de la
investigación científica,cuya función básica es
determinar qparte representatriva de la
población en estudio debe examinarse con el fin
de realizar Inferencia sobre dicha Población. - Razones para tomar muestras
- a) Poblaciones muy grandes ó infinitas ó
desconocidas - b)Costos más económicos en muestras que en
poblaciones - c) Mayor rapidez en la recolección de una m.a que
el de una población - d) Mayor exactitud.-al reducirse el volumen de
trabajo se puede emplear personal más capacitado
y someterlo a un entrenamiento intensivo,supervisi
ón del trabajo de campo y procesamiento de los
resultados,resultados más exactos que la
enumeración completa - e)Destrucción de las unidades estudiadas
11Tipos de muestreo
NO PROBABILÍSTICO INVESTIGADOR CONOCE LAS CARACTERÍSTICAS DE LA POBLACIÓN ?CERTIDUMBRE ? ? VARIABLE ESTADÍSTICA ?ESTADÍSTICA DESCRIPTIVA PROBABILÍSTICO INVESTIGADOR NO CONOCE LAS CARACTERÍSTICAS DE LA POBLACIÓN ?INCERTIDUMBRE ?VARIABLE ALEATORIA ?ESTADÍSTICA INFERENCIAL
12TIPOS DE MUESTREO PROBABILÍSTICOS
- MUESTREO ALEATORIO SIMPLE ( M.A.S.)
- MUESTREO ALEATORIO SISTEMÁTICO(M.A.Sys)
- MUESTREO ALEATORIO ESTRATIFICADO(M.A.E)
- MUESTREO ALEATORIO CONGLOMERADO(M.A.C.)
- MUESTREO POLIETÁPICO(M.U.M)
13MUESTREO ALEATORIO SIMPLE (M.A.S) CON ó sin
REPOSICIÓN
- La población es homogénea y no muy grande, todos
los elementos tienen la misma posibilidad de ser
tomados en cuenta - PROCEDIMIENTO.- las extracciones que se realizan
manual ó mediante la generación de Nº aleatorios
mediante el PC ,con reposición son independientes
,y si es sin reposición son dependientes
Sea una N(1000)
20
100
1
14MUESTREO ALEATORIO SISTEMÁTICO (M.A.Sys) Sea
una población grande homogénea N 1000 ,se toma
una m.a. n50?KN / n 1000 / 5020
1k 20 2k40 3k60 4k80 5k100
6k120 7k 8k 9k 10k
46k 47k 48k960 49k980 50k1000
15 Ventajas y desventajas del M.A.Sys
- Ventajas
- - Mayor representatividad que un m.a.s. porque es
más facíl sacar una m.a y se lo puede hacer en
una oficina ahorrando tiempo - -Es casi tan preciso como el estratificado
- Desventajas.
- -Sólo se pueden tomar k muestras distintas
- -Los elementos de la m.a son dependientes
- -No es válido si la característica se presenta
periodicamente y no coincide con la posición K
16Muestreo aleatorio estratificado (M.A.E)Se
aplica en poblaciones heterogéneas desde el punto
de vista de la característica.por lo que se
divide en L clases o L estratos homogéneos
- Sea una Población heterogénea dispersa N tal
que N1N2Nl N - Ni subpoblaciones, cuya m.a. n tal que
n1n2nl n - estratos ni
submuestras -
-
-
-
-
N1 n1 N2 n2 N3 n3
N4 n4 NL nl
n1
n2
n3
nl
n4
17Ventajas y desventajas del M.A.E.
- Ventajas.-
- -permite aplicar técnicas de selección diferentes
en cada estrato - -Permite realizar inferencia en cada uno de los
estratos. - -Mayor precisión en los estimadores
- -Permite disminuir el tamaño de la muestra
- Desventajas.- si la población está muy dispersa
se requiere mucho dinero en cuanto al aspecto
logístico
18Selección del tamaño de cada submuestra en el
M.A.E
- -Afijación uniforme (ninjnl)
- -Afijación proporcional /estrato (Wh Nh/N)
- -Afijación de Mínima Varianza
- -Afijación óptima( en función de sus costos)
- (V óptima V proporcional V ran)
19Notación y definición en el M.A.E
- .-Una vez estratificado la población y
determinados las submuestras - -Los símbolos que se refieren al estrato h. son
- h Identidad del estrato , i la unidad dentro
el estrato - NhNº total de unidades en el h-ésimo estrato
- nhnº de unidades en la h-ésima muestra
- yhi valor obtenido para la i-ésima unidad del
h-esimo estrato - Wh Nh / N ponderación del estrato h-ésimo
- fh nh / Nh fracción del muestreo del
h-ésimo estrato - Ÿh ? yhi / Nh media verdadera ÿ ? yhi
/nh media muestral del h-ésimo estrato - S²h ?( yhi Ÿh ) ² / Nh varianza verdadera
del h-ésimo estrato
20Muestreo aleatorio por conglomerados
(M.A.C)Se aplica también en poblaciones
heterogéneas y dispersonas desde el punto de
vista geográfico
- Sea una población muy heterogénea y dispersa
desde el punto de vista geográfico N se divide en
Mu unidades de conglomerados heterogéneos - M1 M2 M3 .. Mu
M1 M2 M3 . . Mu
nu
n3
n1
n2
21Muestreo polietápico(MUM)
- En la práctica casi es común utilizar diferentes
tipos de muestreo ,es decir debe realizar en
varias etapas ,así por ejemplo cuando se
utiliza el M.A.E ó el M.A.C ,en cada estrato ó
en cada conglomerado se debe aplicar el M.A.S. - Otro caso tenemos en el muestreo de laUnidad
monetaria gralmente aplicable en Auditoría que
consiste en tomar como unidades aquellos
expedientes con mayor cantidad monetaria y dentro
cada expediente aplicar el M.A.S.
22- 2.Estadísticos muestrales
- DEFINICIÓN Y NOTACIÓN.-.
- -CARACTERÍSTICAS O ATRIBUTOS(Y).- ciertas
propiedades qse quiere medir,analizar,registrar,
etc. Para cada unidad de la población si es
muestral (y). - CARACTERÍSTICAS QUE ANALIZA EL MUESTREO.-
- Analiza 4 características de la población
- 1) El total (Y)
- 2)la Media E ( Y)
- 3) La Proporción(P)
- 4)La Razón( R )
-
23 NOTACIÓN Característica Población(N)
Muestra(n) 1.-Valores yi y1,y2,...,yN
yi y1,y2,...,yn 2.-Total Y?yi
y1y2,...,yN y ? yi y1 y2,..., yn
3.-La Media Ÿ ? yi / N ÿ
? yi / n 4.-La Razón R Y / X
r y / x 5.-Proporción P X/N
p x/n
24Estadísticos muestrales
- ESTIMACIONES Ó ESTADÍGRAFOS
- a)Del total(Y)
- ? Y N ÿ N ? yi / n,donde N/ n factor de
expansión - b) De la media (Ÿ) ? ÿ ? yi / n ,donde
n/N f ,fracción muestral - c)De la Varianza(s²) ? S² ?(xi-x)²/ n
- c) De la razón(R) ? r y / x ? yi / ?
xi
25- ESTADÍSTICOS MUESTRALES
- Varianza muestral S² S ( yi y )²/ n
- Varianza de Cochran ó
- cuasi varianza S² S ( yi y )²/ n-1
- Media muestral E(y ) Y µ
- Varianza de la media muestral V(y) s²/ n
- Media de la Varianza muestral E(S²) (n-1)s²/n
- MEDIA DE LA CUASI VARIANZA E(S²) s²
- Caso particular si Y ?Bernoulli(p)
- Proporción muestral p y/n ó Syi/n
- Media de la proporción muestral E(p) P
- Varianza de la proporción muestral V(p) pq/n
26INTERVALOS DE CONFIANZA.- (n ? 50)
- 1.-IC PARA LA MEDIA (Ÿ) al 100 r ÿ Zo S
? 1 f / ? n - donde Zo ? P(Zlt Zo) (1 r) / 2
- 2.-IC PARA EL TOTAL (Y). Al 100r Nÿ ZoN
S ? 1 f / ? n - -3.-IC para la Proporción (P) al 100 p Zo S
? 1 f / ? n - Nota cuando la muestra es pequeña ,es decir n
lt 50 ? se debe utilizar la distribución t, El
valor crítico es to - donde to? P(Tltto) (1 r) / 2 tiene
distribución n-1 g.d l. - NIVELES DE SIGNIFICACIÓN (?) 50 20 10 5
1 - NIVELES DE CONFIANZA ( r ) 50 80 90
95 99 - VALORES CRÍTICOS (n50) ( Zo) 0.67 1.28
1.65 1.96 2.58
27Ej. Se recabó información sobre una cadena de
676 internets.Cada internet tiene 42 CPUs
,pero en muchos internetsde no todos los PC
funcionan normalmente.Se contó el Nº CPUs por
internet que funcionan normalmente. De 50
Internets(aprox. El 7) cuyos resultados están en
la tabla,donde NTamaño de la póblación 676
n50 yi nº de PC qfuncionan fi f
recuencias./,internet Se pide estimar a) El
Nº total de PC que funcionan normalmente
b)La
varianza de la muestra c)El IC para el total
al 80 yi 42 41 36 32 29 27 23 19
16 15 14 11 10 9 7 6 5 4 3
Total fi 23 4 1 1 1 2 1 1
2 2 1 1 1 1 1 3 2 1 1
50 Yifi 966 10 4
3 1 471 yi²fi40572
50 16 9 54 497
28Sol.- Datos . N 676 Unidad muestral internet
n 50 internet a)Estimación del Total Y? Y Nÿ
N ?yi fi / n 676 (1471)/ 5019888 fPC
qfuncionan normalmente b) Varianza muestral S²
(1 / n-1) ?yi² fi ( ?yi fi )²/n,reemplazando
S² (1/ 49) 54497 (1471)²/ 50 229.0
PC² la desviación típica S ?229 firmas ²
15.1327 PC c) El IC para el total(Y) al
80, 19888 1.28(676)(15.13)(0.9623) / ? 50
18 107 21 669 Significa que de entre
100 muestras diferentes que se pueden obtener de
ésa población se espera que 80 muestras darán la
estimación del total entre 18 107 y 21 669 PC
que funcionan normalmente
294.-TAMAÑO MUESTRAL
- En forma general depende
- 1)Si la población es finita conocida ó infinita
desconocida - 2)Del Error admitido ( acuerdo a la calidad de la
v.a.) - 3)Del nivel de significación( a ?Mín)
- 4)Del tipo de muestreo aplicable(con o sin
reposicion) - 5)Del estadístico utilizado en la investigación
- La fórmula gral n no N / no (N-1)
- donde ntamaño de la muestra
- N tamaño de la
población - no tamaño de la m.a
inicial -
30Determinación del tamaño de la muestrainicial no
a) Para la media 1) no (Zo s/ E)²(n50) 2) no (to S/ E)²(nlt50) Donde ZoP(Zltzo)(1r)/2 to P(Tltto) (1r)/2 to?T con n-1 gdl b) Para la proporción Si se supone P conocido 3) no Zo²pq/E² (n50) Si no se conoce P 4)no1/4 (Zo/E)² Donde ZoP(Zltzo)(1r)/2
31Ejemplos para estimar el tamaño de la m.a.
- Ej. 1)Un investigador quiere determinar el tiempo
promedio que un ensamblador tarda en ensamblar
las partes de un ordenador,con una confianza del
95 que la media de su m.a. tenga un error a lo
máximo de 0.50 minutos.Se presume por
experiencia que la s 1.6 minutos.Qué tamaño debe
ser la muestra? - Solución Ytiempo de ensamblaje en minutos
- Datos E0.5, s 1.6 r95 ?Zo1.96
- Por 1) n (Zo s/ E)² ? n(1.961.6 /0.5)² 39.3
40 -
- n 40
32- Ej 2)Se desea estimar el Nº promedio de días de
uso continuo antes de que cierto tipo de PC
requiera su reparación inicial, si se supone que
la s 6 días de un lote de 100 PCs .De qué
tamaño debe ser la m.a. para asegurar con una
confianza del 90 que la media muestral difiera a
lo más por 2 días? - Solución.- YTiempo de uso del pc en días
- Datos N 100 s 6 r 0.90 ? Zo 1.645 ,E2
- Por la fórmula generaln no N/ no (N-1)
- no (1.6456 /2)² 24.354225
- n 24.354225100 / 24.354225(100-1) 19.7420
33- Ej.3)Se desea estimar la Proporción real de CDs
defectuosos en un importación muy grande ,al
nivel de un 95 se admite un error a lo sumo de
un 4.de qué tamaño debe ser la m.a. si - a) No se conoce la proporción real
- b)Se sabe q la proorción real de defectuosos es
12 - c)Si se conoce el tamaño de la Importación 5000
- Solución.-a) r0.95?Zo1.96E0.04 n?
- Por 4) no (Zo/2E)² (1.96 / 20.04)² 600
- b) p0.12 ?q0.88 por 3) no Zo²pq/E²
- n 1.96²(0.12)(0.88) / (0.04)² 254
- c) N5000 por n no N/ no (N-1)
- n2545000 /254 (5000-1) 242
34- Conctrucción de los estratos
- Una población de 13 435 datos cuya Distribución
de frecuencias .Determinar a) los tamaños de los
estratos(Nh) b)elTamaño de la m.a (n) si se
quiere minimizar el mismo para una V(ÿst) 0.01
puede obiar la cpf.c) Determine los tamaños de
las submuestras - Deterdeterminar vfi? la F(v fi). De la siguiente
manera. - Ii fi vfi F(vfi) Ii
fi v fi F(vfi ) - 0 -5 3464 58.9 58.9
50-55 125 11.2 340.3 - 5-10 2516 50.2 109.1 55-60
107 10.3 350.6 - 10-15 2157 46.4 155.5 60-65
82 9.1 359.7 - 15-20 1581 39.8 195.3 65-70
50 7.1 366.8 - 20-25 1142 33.8 229.1 70-75
39 6.2 373.0 - 25-30 746 27.3 256.4 75-80
25 5.0 378.0 - 30-35 512 22.6 279.0 80-85
16 4.0 382.0 - 35-40 376 19.4 298.4 85-90
19 4.4 386.4 - 40-45 265 16.3 314.7 90-95
2 1.4 387.8 - 45-50 207 14.4 329.1 95-100
3 1.7 389.5
35- Construción de estratos
- Suponiendo se quiere tener 5 estratos
- Supuestamente serían F(vfi )/ L 389/5 77.9
- 77.9 -155.8 -233.7- 311.6 pero los nº más
cercanos son - Estratos
- 1 2 3 4
5 - Ii. 0-5 5-15 15-25 25-45 45-100
- Fi,vfi 58.9 96.6 73.6 85.6
74.8
36-
- N1 3464 N2 4673 N32723 N41899 N5676
- W1 N1/N 3464/134350.26 W24673/134350.35
W3 0.20 W40.14 W50.05 - n1 ? n2? n3 ? n4 ?
n5 ? - h Wh Sh WhSh nh W1 N1/N
3464/134350.26 - 1 0.26 5 1.30 903
- 2 0.35 10 3.50 2432
- 3 0.20 7 1.40 973
- 4 0.14 5 0.70 486
- 5 0.05 1 0.05 36
- Total 1 69.5 4830
37- A) por D)Asignación óptima revisada
- Vmin(ÿst)(SWhSh)² / n) S WhSh² / N (cpf)
- 0.01 (6.95)²/n ? n 4830
- b) Por A)Minimizar V(ÿst) para un n total fijo
(NEYMAN) - nh nWhSh / SWhSh nNhSh / SNhSh
- n14830(1.3)/6.95 903
- n2 4830(3.5)/6.952432
- n3 4830(1.4)/6.95 973
- n4 4830(0.7)/6.95 486
- n5 4830(0.05)/6.95 36
- n4830
-
38- VARIABLES ESTADÍSTICAS
- Es toda característica que se desea estudiar de
la población y que toma mínimamente dos valores - X x1 ,x2,...,xn
- CLASES DE VARIABLES
- 1.-CUANTITATIVAS.- Son aquellas que se pueden
contar o medir,tenemos a) Discreta y b)continuas - 2.-CUALITATIVAS.-Son aquellas que guardan algún
atributo o característica,tenemosa)Nominal y b)
ordinal
39POBLACION (N)
muestreo
MUESTRA (n)
MUESTRA (n)
Estadística descriptiva
Toma de decisiones
Estadística inferencial
40- Metodología de la investigación
- 1.-Planteamiento del problema y de la hipótesis
- Se define claramente los objetivos del
estudio,relacionando con los valores numéricos de
las variables observables(y efecto x causa) - 2.-Recolección de datos
- a)Datos publicados,b)diseño experimental
c)Encuesta - 3.-Organización y clasificación de datos
- se debe realizar un análisis de consistencia
- 4.-Análisis e interpretación de los datos
41- ORGANIZACIÓN DE LOS DATOS
- Una vez recopilados los datos ,éstos se los deben
presentar en - 1.-Cuadros estadísticos.-que deben tener
- a) Título descriptivo y numerado(superior)
- b) Fuente de los datos(pie de página)
- c) Unidades en que se expresan
- 2 .-Gráficos
- a) De barras (Verticales u horizontales)
- b) Circulares
42- DISTRIBUCIÓN DE FREC. DE V .CUALITATIVAS
- Cuadro Nº 1.1. Distrib.de frec. De..........
Categorías X Frecuencias absolutas simples fi Frecuencias relativas hi Porcentajes pi
C1 C2 . . Ck f1 f2 . . fk h1 h2 . . hk p1 p2 . . pk
Totales n 1 100
43- Ejemplo.-
- En una entrevista a 20 alumnos sobre la
preferencia por tipos de ordenadoresA,B,C,se
obtuvieron los siguientes resultado - A,B,B,A,C,B,B,A,A,B,A,B,B,C,A,B,A,C,A,B,
Cuadro nº 1.2.Distrib.de alumnos por pref.de pc -
Tipo de PC X fi hi pi
A 8 0.40 40
B 9 0.45 45
C 3 0.15 15
Totales 20 1.00 100
44Figura Nº gráfica de barras
45- Distribución de frec.de v.cuantitativas discretas
-
Valores X fi hi pi
x1 f1 h1 p1
x2 f2 h2 p2
. . . . . . . .
xk fk hk pk
Totales n 1.00 100
Valores X fi hi pi
x1 f1 h1 p1
x2 f2 h2 p2
. . . . . . . .
xk fk hk pk
Totales n 1.00 100
46- Distrib.de frec. por Intervalos o clases (ngt30)
- Cuadro Nº.. Distrib. de frec. por intérvalos
-
Intérvalos Ii Xi fi hi pi
I1 X1 f1 h1 p1
I2 X2 f2 h2 p2
. . . . . . . . . .
Ik Xk fk hk pk
Totales n 1.00 100
47- Procedimiento ordenar los datos y determinar
- 1.-El alcance (A) AValor Mínimo,Valor
Máximo - 2.-El Rango (R) RValor Máx-valor Mín
- 3.-Nº de Intérvalos (k)
- a) 5 lt k lt 20
- b) k13.3 log(n)
- 4.-Ancho de clase (wi) WiL i 1 -Li
- igual ancho W R/k
- 5.-Marca de clase Xi (Li Li1)/2
48- Ejemplo.- se tiene los ingresos quincenales en
us(X) de 45 familias - 63 89 36 49 56 64 59 35 78
- 43 53 70 57 62 43 68 62 26
- 64 72 52 51 62 60 71 61 55
- 59 60 67 57 67 61 67 51 81
- 53 54 76 44 73 56 62 63 60
-
- Se pide clasificar en 8 clases
49- Cuadro Nº... Distrib.de frec.de los ingresos de
45 familias en dólares -
Ii Xi fi hi pi
26,34gt 34,42gt 42,50gt 50,58gt 58,66gt 66,74gt 74,82gt 82,90gt 30 38 46 54 62 70 78 86 1 2 4 10 16 8 3 1 0.022 0.044 0.089 0.222 0.356 0.178 0.067 0.022 2.2 4.4 8.9 22.2 35.6 17.8 6.7 2.2
totales 45 1.000 100
50- Histograma de los ingresos de 45 familias
-
-
fi
xi
51- Frecuencia absoluta simple fi
- Es el Nº de datos observados en cada categoría
- Tal que Sfi n
- Frecuencia relativa simple hi
- Es la proporción por cada categoría .
- Tal que hi fi/n Shi 1
- Porcentaje pi
- Es el tanto por ciento de cada categoría
- Tal que pi 100hi Spi 100
- Frecuencia Abs.acumulada Fi
- Nº de obs.menores que el límite superior de
determinada clase - Tal que F1f1 Fi F i-1fi
- Frecuencia Relativa acumulada Hi
- Es la proporción menor al límite superior de
determinada clase - Tal que Hi hi , Hi Hi-1 hi Hi
Fi/n i1,2,3,....k
52- TEMA Nº 3 MEDIDAS DE POSICIÓN
- TenemosLa media , la media geométrica
armónica, cuadrática , la mediana,la moda,los
cuantiles - La media aritmética
- a) Para datos no clasificados
- poblacional µ S Xi/N muestral X Sxi/n
- b)Para datos clasificados
- poblacional µ S (xi fi)/Nmuestral X S
(xi fi)/n - Del Ej. De los ingresos de 45 familias ,el
ingreso medio ó percápita es X S (xi fi)/n
2702/45 - X 60,04 us semanal
53- Propiedades de la media aritmética
- Sean a,b,c, constantes x,y variables
- 1.- M( c ) C
- 2.- M( x c ) M( x ) c
- 3.- M( ax ) a M( x )
- 4.- M ( ax b) aM( x ) b
- 5.- M x M( x ) 0
54- La Mediana- Xm ó Md
- 1.-Para datos no clasificados,una vez ordenado,la
mediana es - a) Cuando n es impar es el valor central
- b) Cuando n es par es el promedio de los dos
valores centrales - 2.-Para datos clasificados
- Xm Lm Wm n/2 F m-1 / fm, donde
- la clase mediana se obtiene.
- Fm ? n/2 ? Im Lm ,Lmi 1gt
-
55- LA MODA Xmo Ó Mo.-para datos clasificado
- Mo Li Wi ?1 / (?1 ?2 ) ?1 fi fi-1
?2 fi fi 1 - Ej se tiene la siguiente distribución de
frecuencias de alturas (pulg ) de 100 personas - Hallar a) La media,b)La Mediana c) la Moda
Ii Xi fi Fi Xi fi (xi-67.95)²fi
60-63 63-66 66-69 69-72 72-75 61.5 64.5 67.5 70.5 73.5 5 18 42 27 8 5 23 65 92 100 307.5 1161.0 2835.0 1903.5 588.0 208.0125 214.2450 8.5050 175.5675 2.46.4200
total 100 6795.0 852.7500
56- Solución
- a)la media X 6795 / 100 67,95 pulg
- b)La mediana Xm 66350-23 / 42 67.90 pulg
- c)La moda Mo 66324 / (2415 67.8
pulg - Media geométrica .-(G)se utiliza cuando el
conjunto es una P.G. Porcentajes.índices etc.. - Media armónica (H) .- se utiliza cuando el
conjunto es un P.A., tasas, muestra pequeña etc.
57- Tema nº 4 MEDIDAS DE DISPERSIÓN
- 1.-La varianza V(X)
- Def gral. V(X) E (x x )²
- a) Datos no clasificados
- S² S (xi x)² / n-1
- b) datos clasificados
- S² S (xi x)² fi / n-1
- 2.-La desviación típica s
- s V(x)
- 3.- Coeficiente de variación CV
- CV S / x 100
58- Ej. De la anterior distribución hallar a) la
varianza b) la desviación c) el coeficiente de
variación. - Solución
- a) La varianza
- S² 852.75 / 100 8.5275 pulg ²
- b) La desviación típica
- S 8.5275 pulg² 2.92 pulg
- c) El cv ( 2.92 / 76.95 ) 100 4.30
-
59- Propiedades de la Varianza
- Sean a,b,c constantes, XY variables
- 1.-V( c ) 0
- 2.-V (X c) V(X)
- 3.-V( aX ) a² V (X)
- 4.-V(aX b) a² v(X)
- 5.-V(X)M(x²) M(x) ² donde
- M(x²) ?xi² /n, para datos no clasificados
- M(x²) ?xi²fi / n,para datos clasificados
-
60- Momentos.- Definición Gral E (x-a) r
1,2,3,.. - a) Momentos originales si a0
- mr E x S xi fi / n
- b) Momentos centrales si a x
- m r E (xi-x) S( xi-x)fi / n r
1,2,3.... - Coeficiente de asimetría
- Sk ( x Mo) / s , si Sk gt 0 sesgado a
la derecha -
Sk lt 0 sesgado a la izquierda -
Sk 0 simétrico - Coeficiente de Kurtosis
- Cx ?4 / (?²)² si Cx gt0 ?
leptocúrtico -
si Cx lt0 ? platicúrtico - si Cx 0 ?
mesocúrtico
61- Tema nº 5 REGRESIÓN LINEAL SIMPLE
- V.E.Bidimensional (X,Y)
- -La regresión surge en el análisis de la forma
funcional entre X (causa) ,Y(efecto) - -La correlación surge en el análisis de
asociación entre X ,Y - - Diagrama de dispersión .- es el gráfico de
los pares (xy) ,que da la pauta de la forma
funcional entre X e Y - - La covarianza mide el grado de dispersión
conjunta entre X ,Y - Coeficiente de correlación r.-mide el grado de
asociación lineal entre X e Y - -1lt r lt 1
62- Regresión lineal simple .- Y a bX ,consiste
en estimar la ec.de la recta con el fin de
predecir o estimar Y (dependiente) a partir de x(
independiente) - Donde a intercepto b pendiente o coeficiente
de regresión - Estimación mediante los MCO
- Y â b X donde b n Sxiyi SxiSyi /
nSx²-(Sx)² - â y b x
- si bgt0 la tendencia lineal es creciente
- si blt0 la tendencia lineal es decreciente
- si b0 no hay regresión por que Y a
63- Ejemplo.-
- En un estudio de la relación entre la
publicidad por tv y las ventas de ordenadores
durante 10 semanas se han recopilado los tiempos
de duración en minutos de publicidad por semana
(X) y el nº de ordenadores vendidos(y) siendo - Semana 1 2 3 4 5 6 7
8 9 10 - Publicidad(X) 20 30 30 40 50 60 60 60
70 80 - Ventas(Y) 50 73 69 87 108 128 135 132 148
170 - a)Estimar la recta de regresión ,b) el r c)
Estime las ventas si la publicidad es de 90
minutos
64x y xy X² Y²
20 30 30 40 50 60 60 60 70 80 50 73 69 87 108 128 135 132 148 170 1000 2190 2070 3480 5400 7680 8100 7920 10360 13600 400 900 900 1600 2500 3600 3600 3600 4900 6400 2500 5329 4761 7569 11664 16384 18225 17424 21904 28900
500 1100 61800 28400 134660
65- SOLUCIÓN
- b10(61800)-500(11009 / 10(28400)-500²
- b 68000 / 34002 b2
- a 110- 2(50) 10 a10
- Por lo tanto y 10 2 X
- b) El r n Sxiyi SxiSyi / nSx²-(Sx)²
nSy²-(Sy)² - 680 /681.5424 0.998 , r0.998 altamente
positivo - c) Estimación para x70 y 10 2 (90) 190
ordenadores