ESTAD - PowerPoint PPT Presentation

About This Presentation
Title:

ESTAD

Description:

Title: Presentaci n de PowerPoint Last modified by: INTEL Created Date: 1/1/1601 12:00:00 AM Document presentation format: Presentaci n en pantalla – PowerPoint PPT presentation

Number of Views:76
Avg rating:3.0/5.0
Slides: 66
Provided by: edub92
Category:

less

Transcript and Presenter's Notes

Title: ESTAD


1
ESTADÍSTICA DESCRIPTIVA
2
COMPETENCIAS Y OBJETIVOS
  • UNIDAD I ESTADISTICA DESCRIPTIVA
  • Competencia
  • -El estudiante debe utilizar correctamente los
    procedimientos ,técnicas y métodos
    estadísticos,en el tratamiento y procesamiento de
    datos de todo trabajo de investigación científica
  • Objetivos.
  • -Aplicar adecuadamente las técnicas y
    procedimientos estadísticos como metodología de
    toda investigación principalmente en la
    Ingeniería.
  • Descripción general de la unidad
  • -Esta unidad comprende el desarrollo de los
    siguientes aspectos ciclo metodológico de la
    investigación estadística, recopilación.
    organización ,clasificación y descripción de
    datos de una muestra aleatoria o población
    determinación y utilización de las medidas
    descriptivas.
  • LecturaMillar/Freund/Jonson
    Probabilidad y Estadística para
    IngenierosEdo.de México 1992 Pgs.1 al 40
  • Córdova Zamora
    Estadística Descriptiva e Inferencial 2ª
    ed.Perú 1996 Pags,1 al 69
  • Bibliografía Básica García Oré
    (1995) Estadística descriptiva y
    Probabilidades(2ª ed) Perú .Pags.2al 83
  • Referencia electrónica
    http//thales.cica.es/red/Recursos/rd99/ed99-0278-
    01/inicio.html

3
Estadística Descriptiva
CONTENIDO MÍNIMO 1.-INTRODUCCIÓN A LA
ESTADÍSTICA(muestreo) 2.-ORGANIZACIÓN Y
CLASIFICACIÓN DE DATOS 3.-MEDIDAS DE
POSICIÓN 4.-MEDIDAS DE DISPERSIÓN 5.-REGRESIÓN
LINEAL SIMPLE
4
Introducción a la Estadística
  • 1.-DEFINICIÓN.- Como ciencia proporciona un
    conjunto de métodos,técnicas y/o procedimientos
    ,para recopilar,organizar,presentar ,analizar
    datos,con el fin de realizar generalizaciones
    válidas,para tomar decisiones coherentes,ante la
    incertidumbre,acerca de la población o sus
    parámetros a partir de datos extraídos de una
    muestra.
  • ESTADÍSTICA DESCRIPTIVA.
  • ESTADÍSTICA INFERENCIAL

5
  • POBLACIÓN (N).-Conjunto universo,motivo de
    análisis que tiene por lo menos alguna
    característica en común,el proceso para obtener
    toda la información de la población se llama
    censo
  • PARÁMETRO.- Es un nº resumen que sintetiza
    alguna característica de la población
  • MUESTRA (n).- Es un subconjunto propio
    representativo de la población,el proceso para la
    obtención de los datos muestrales se llama
    muestreo
  • ESTADÍGRAFO.-Es un nº sintético que resume
    alguna característica de la muestra

6
1.- INTRODUCCIÓN AL MUESTREO
  • PROCESO DEL DESARROLLO CIENTÍFICO

DESARROLLO DEL CONOCIMIENTO
MÉTODO CIENTÍFICO
7
PERFIL DE TESIS
  • TÍTULO
  • JUSTIFICACIÓN
  • FORMULACIÓN DEL PROBLEMA
  • HIPÓTESIS
  • OBJETIVOS
  • METODOLOGÍA
  • MÉTODOS inductivo,deductivo,hidtórico,ló
    gico,experimental etc.
  • .TÉCNICAS DE RECOLECCIÓN DE datos
    (muesreo)
  • DE PROCESAMIENTO DE
    DATOS(Estadística Inferencial)
  • INSTRUMENTOS SOFTWARE ESTADÍSTICO)
  • MARCO TEÓRICO Y REFERENCIAL
  • ESQUEMA TENTATIVO DE LA TÉSIS O PROYECTO DE
    GRADO
  • ANEXOS
  • BIBLIOGRAFÍA

8
  • Metodología de la investigación
  • 1.-Planteamiento del problema y de la hipótesis
  • Se define claramente los objetivos del
    estudio,se toma una m.a. cuyos datos se utilizan
    para la inferencia sobre el modelo asignado ó
    contrastando valores para sus parámetros
  • 2.-Recolección de datos
  • a)Datos publicados,b)diseño experimental
    c)Encuesta
  • 3.-Organización y clasificación de datos
  • se debe realizar un análisis de consistencia
  • 4.-Análisis e interpretación de los datos

D E S C R I P T I V A
9
  • METODOLOGIA DE LA INVESTIGACIÓN
  • 5.-Realización de Inferencia
  • PRUEBAS PARAMÉTRICAS .-representar la
    incertidumbre asociada a la característica en
    cuestión ,a un modelo probabilístico cuyos
    parámetros se desconocen
  • Estimación de los estadísiticos
  • a) Puntual ,b) Por Intervalos de Confianza
  • 6.-Realizar el TEST DE HIPóTESIS
  • Contrastar la validez de algún supuesto
  • acerca de los valores de los parámetros ó
  • de la Distribución del modelo ,(por IC ó de
    Siginificancia,y el P value),ó predecir.

I N F R E N C I A
10
1.2.- Tipos de Muestreo
  • Muestreo.- herramienta fundamental de la
    investigación científica,cuya función básica es
    determinar qparte representatriva de la
    población en estudio debe examinarse con el fin
    de realizar Inferencia sobre dicha Población.
  • Razones para tomar muestras
  • a) Poblaciones muy grandes ó infinitas ó
    desconocidas
  • b)Costos más económicos en muestras que en
    poblaciones
  • c) Mayor rapidez en la recolección de una m.a que
    el de una población
  • d) Mayor exactitud.-al reducirse el volumen de
    trabajo se puede emplear personal más capacitado
    y someterlo a un entrenamiento intensivo,supervisi
    ón del trabajo de campo y procesamiento de los
    resultados,resultados más exactos que la
    enumeración completa
  • e)Destrucción de las unidades estudiadas

11
Tipos de muestreo
NO PROBABILÍSTICO INVESTIGADOR CONOCE LAS CARACTERÍSTICAS DE LA POBLACIÓN ?CERTIDUMBRE ? ? VARIABLE ESTADÍSTICA ?ESTADÍSTICA DESCRIPTIVA PROBABILÍSTICO INVESTIGADOR NO CONOCE LAS CARACTERÍSTICAS DE LA POBLACIÓN ?INCERTIDUMBRE ?VARIABLE ALEATORIA ?ESTADÍSTICA INFERENCIAL

12
TIPOS DE MUESTREO PROBABILÍSTICOS
  • MUESTREO ALEATORIO SIMPLE ( M.A.S.)
  • MUESTREO ALEATORIO SISTEMÁTICO(M.A.Sys)
  • MUESTREO ALEATORIO ESTRATIFICADO(M.A.E)
  • MUESTREO ALEATORIO CONGLOMERADO(M.A.C.)
  • MUESTREO POLIETÁPICO(M.U.M)

13
MUESTREO ALEATORIO SIMPLE (M.A.S) CON ó sin
REPOSICIÓN
  • La población es homogénea y no muy grande, todos
    los elementos tienen la misma posibilidad de ser
    tomados en cuenta
  • PROCEDIMIENTO.- las extracciones que se realizan
    manual ó mediante la generación de Nº aleatorios
    mediante el PC ,con reposición son independientes
    ,y si es sin reposición son dependientes
    Sea una N(1000)

20
100
1
14
MUESTREO ALEATORIO SISTEMÁTICO (M.A.Sys) Sea
una población grande homogénea N 1000 ,se toma
una m.a. n50?KN / n 1000 / 5020
1k 20 2k40 3k60 4k80 5k100
6k120 7k 8k 9k 10k

46k 47k 48k960 49k980 50k1000
15
Ventajas y desventajas del M.A.Sys
  • Ventajas
  • - Mayor representatividad que un m.a.s. porque es
    más facíl sacar una m.a y se lo puede hacer en
    una oficina ahorrando tiempo
  • -Es casi tan preciso como el estratificado
  • Desventajas.
  • -Sólo se pueden tomar k muestras distintas
  • -Los elementos de la m.a son dependientes
  • -No es válido si la característica se presenta
    periodicamente y no coincide con la posición K

16
Muestreo aleatorio estratificado (M.A.E)Se
aplica en poblaciones heterogéneas desde el punto
de vista de la característica.por lo que se
divide en L clases o L estratos homogéneos
  • Sea una Población heterogénea dispersa N tal
    que N1N2Nl N
  • Ni subpoblaciones, cuya m.a. n tal que
    n1n2nl n
  • estratos ni
    submuestras


N1 n1 N2 n2 N3 n3
N4 n4 NL nl
n1
n2
n3
nl
n4
17
Ventajas y desventajas del M.A.E.
  • Ventajas.-
  • -permite aplicar técnicas de selección diferentes
    en cada estrato
  • -Permite realizar inferencia en cada uno de los
    estratos.
  • -Mayor precisión en los estimadores
  • -Permite disminuir el tamaño de la muestra
  • Desventajas.- si la población está muy dispersa
    se requiere mucho dinero en cuanto al aspecto
    logístico

18
Selección del tamaño de cada submuestra en el
M.A.E
  • -Afijación uniforme (ninjnl)
  • -Afijación proporcional /estrato (Wh Nh/N)
  • -Afijación de Mínima Varianza
  • -Afijación óptima( en función de sus costos)
  • (V óptima V proporcional V ran)

19
Notación y definición en el M.A.E
  • .-Una vez estratificado la población y
    determinados las submuestras
  • -Los símbolos que se refieren al estrato h. son
  • h Identidad del estrato , i la unidad dentro
    el estrato
  • NhNº total de unidades en el h-ésimo estrato
  • nhnº de unidades en la h-ésima muestra
  • yhi valor obtenido para la i-ésima unidad del
    h-esimo estrato
  • Wh Nh / N ponderación del estrato h-ésimo
  • fh nh / Nh fracción del muestreo del
    h-ésimo estrato
  • Ÿh ? yhi / Nh media verdadera ÿ ? yhi
    /nh media muestral del h-ésimo estrato
  • S²h ?( yhi Ÿh ) ² / Nh varianza verdadera
    del h-ésimo estrato

20
Muestreo aleatorio por conglomerados
(M.A.C)Se aplica también en poblaciones
heterogéneas y dispersonas desde el punto de
vista geográfico
  • Sea una población muy heterogénea y dispersa
    desde el punto de vista geográfico N se divide en
    Mu unidades de conglomerados heterogéneos
  • M1 M2 M3 .. Mu

M1 M2 M3 . . Mu
nu
n3
n1
n2
21
Muestreo polietápico(MUM)
  • En la práctica casi es común utilizar diferentes
    tipos de muestreo ,es decir debe realizar en
    varias etapas ,así por ejemplo cuando se
    utiliza el M.A.E ó el M.A.C ,en cada estrato ó
    en cada conglomerado se debe aplicar el M.A.S.
  • Otro caso tenemos en el muestreo de laUnidad
    monetaria gralmente aplicable en Auditoría que
    consiste en tomar como unidades aquellos
    expedientes con mayor cantidad monetaria y dentro
    cada expediente aplicar el M.A.S.

22
  • 2.Estadísticos muestrales
  • DEFINICIÓN Y NOTACIÓN.-.
  • -CARACTERÍSTICAS O ATRIBUTOS(Y).- ciertas
    propiedades qse quiere medir,analizar,registrar,
    etc. Para cada unidad de la población si es
    muestral (y).
  • CARACTERÍSTICAS QUE ANALIZA EL MUESTREO.-
  • Analiza 4 características de la población
  • 1) El total (Y)
  • 2)la Media E ( Y)
  • 3) La Proporción(P)
  • 4)La Razón( R )

23

NOTACIÓN Característica Población(N)
Muestra(n) 1.-Valores yi y1,y2,...,yN
yi y1,y2,...,yn 2.-Total Y?yi
y1y2,...,yN y ? yi y1 y2,..., yn
3.-La Media Ÿ ? yi / N ÿ
? yi / n 4.-La Razón R Y / X
r y / x 5.-Proporción P X/N
p x/n
24
Estadísticos muestrales
  • ESTIMACIONES Ó ESTADÍGRAFOS
  • a)Del total(Y)
  • ? Y N ÿ N ? yi / n,donde N/ n factor de
    expansión
  • b) De la media (Ÿ) ? ÿ ? yi / n ,donde
    n/N f ,fracción muestral
  • c)De la Varianza(s²) ? S² ?(xi-x)²/ n
  • c) De la razón(R) ? r y / x ? yi / ?
    xi

25
  • ESTADÍSTICOS MUESTRALES
  • Varianza muestral S² S ( yi y )²/ n
  • Varianza de Cochran ó
  • cuasi varianza S² S ( yi y )²/ n-1
  • Media muestral E(y ) Y µ
  • Varianza de la media muestral V(y) s²/ n
  • Media de la Varianza muestral E(S²) (n-1)s²/n
  • MEDIA DE LA CUASI VARIANZA E(S²) s²
  • Caso particular si Y ?Bernoulli(p)
  • Proporción muestral p y/n ó Syi/n
  • Media de la proporción muestral E(p) P
  • Varianza de la proporción muestral V(p) pq/n

26
INTERVALOS DE CONFIANZA.- (n ? 50)
  • 1.-IC PARA LA MEDIA (Ÿ) al 100 r ÿ Zo S
    ? 1 f / ? n
  • donde Zo ? P(Zlt Zo) (1 r) / 2
  • 2.-IC PARA EL TOTAL (Y). Al 100r Nÿ ZoN
    S ? 1 f / ? n
  • -3.-IC para la Proporción (P) al 100 p Zo S
    ? 1 f / ? n
  • Nota cuando la muestra es pequeña ,es decir n
    lt 50 ? se debe utilizar la distribución t, El
    valor crítico es to
  • donde to? P(Tltto) (1 r) / 2 tiene
    distribución n-1 g.d l.
  • NIVELES DE SIGNIFICACIÓN (?) 50 20 10 5
    1
  • NIVELES DE CONFIANZA ( r ) 50 80 90
    95 99
  • VALORES CRÍTICOS (n50) ( Zo) 0.67 1.28
    1.65 1.96 2.58

27

Ej. Se recabó información sobre una cadena de
676 internets.Cada internet tiene 42 CPUs
,pero en muchos internetsde no todos los PC
funcionan normalmente.Se contó el Nº CPUs por
internet que funcionan normalmente. De 50
Internets(aprox. El 7) cuyos resultados están en
la tabla,donde NTamaño de la póblación 676
n50 yi nº de PC qfuncionan fi f
recuencias./,internet Se pide estimar a) El
Nº total de PC que funcionan normalmente
b)La
varianza de la muestra c)El IC para el total
al 80 yi 42 41 36 32 29 27 23 19
16 15 14 11 10 9 7 6 5 4 3
Total fi 23 4 1 1 1 2 1 1
2 2 1 1 1 1 1 3 2 1 1
50 Yifi 966 10 4
3 1 471 yi²fi40572
50 16 9 54 497
28
Sol.- Datos . N 676 Unidad muestral internet
n 50 internet a)Estimación del Total Y? Y Nÿ
N ?yi fi / n 676 (1471)/ 5019888 fPC
qfuncionan normalmente b) Varianza muestral S²
(1 / n-1) ?yi² fi ( ?yi fi )²/n,reemplazando
S² (1/ 49) 54497 (1471)²/ 50 229.0
PC² la desviación típica S ?229 firmas ²
15.1327 PC c) El IC para el total(Y) al
80, 19888 1.28(676)(15.13)(0.9623) / ? 50
18 107 21 669 Significa que de entre
100 muestras diferentes que se pueden obtener de
ésa población se espera que 80 muestras darán la
estimación del total entre 18 107 y 21 669 PC
que funcionan normalmente

29
4.-TAMAÑO MUESTRAL
  • En forma general depende
  • 1)Si la población es finita conocida ó infinita
    desconocida
  • 2)Del Error admitido ( acuerdo a la calidad de la
    v.a.)
  • 3)Del nivel de significación( a ?Mín)
  • 4)Del tipo de muestreo aplicable(con o sin
    reposicion)
  • 5)Del estadístico utilizado en la investigación
  • La fórmula gral n no N / no (N-1)
  • donde ntamaño de la muestra
  • N tamaño de la
    población
  • no tamaño de la m.a
    inicial

30
Determinación del tamaño de la muestrainicial no
a) Para la media 1) no (Zo s/ E)²(n50) 2) no (to S/ E)²(nlt50) Donde ZoP(Zltzo)(1r)/2 to P(Tltto) (1r)/2 to?T con n-1 gdl b) Para la proporción Si se supone P conocido 3) no Zo²pq/E² (n50) Si no se conoce P 4)no1/4 (Zo/E)² Donde ZoP(Zltzo)(1r)/2

31
Ejemplos para estimar el tamaño de la m.a.
  • Ej. 1)Un investigador quiere determinar el tiempo
    promedio que un ensamblador tarda en ensamblar
    las partes de un ordenador,con una confianza del
    95 que la media de su m.a. tenga un error a lo
    máximo de 0.50 minutos.Se presume por
    experiencia que la s 1.6 minutos.Qué tamaño debe
    ser la muestra?
  • Solución Ytiempo de ensamblaje en minutos
  • Datos E0.5, s 1.6 r95 ?Zo1.96
  • Por 1) n (Zo s/ E)² ? n(1.961.6 /0.5)² 39.3
    40
  • n 40

32
  • Ej 2)Se desea estimar el Nº promedio de días de
    uso continuo antes de que cierto tipo de PC
    requiera su reparación inicial, si se supone que
    la s 6 días de un lote de 100 PCs .De qué
    tamaño debe ser la m.a. para asegurar con una
    confianza del 90 que la media muestral difiera a
    lo más por 2 días?
  • Solución.- YTiempo de uso del pc en días
  • Datos N 100 s 6 r 0.90 ? Zo 1.645 ,E2
  • Por la fórmula generaln no N/ no (N-1)
  • no (1.6456 /2)² 24.354225
  • n 24.354225100 / 24.354225(100-1) 19.7420

33
  • Ej.3)Se desea estimar la Proporción real de CDs
    defectuosos en un importación muy grande ,al
    nivel de un 95 se admite un error a lo sumo de
    un 4.de qué tamaño debe ser la m.a. si
  • a) No se conoce la proporción real
  • b)Se sabe q la proorción real de defectuosos es
    12
  • c)Si se conoce el tamaño de la Importación 5000
  • Solución.-a) r0.95?Zo1.96E0.04 n?
  • Por 4) no (Zo/2E)² (1.96 / 20.04)² 600
  • b) p0.12 ?q0.88 por 3) no Zo²pq/E²
  • n 1.96²(0.12)(0.88) / (0.04)² 254
  • c) N5000 por n no N/ no (N-1)
  • n2545000 /254 (5000-1) 242

34
  • Conctrucción de los estratos
  • Una población de 13 435 datos cuya Distribución
    de frecuencias .Determinar a) los tamaños de los
    estratos(Nh) b)elTamaño de la m.a (n) si se
    quiere minimizar el mismo para una V(ÿst) 0.01
    puede obiar la cpf.c) Determine los tamaños de
    las submuestras
  • Deterdeterminar vfi? la F(v fi). De la siguiente
    manera.
  • Ii fi vfi F(vfi) Ii
    fi v fi F(vfi )
  • 0 -5 3464 58.9 58.9
    50-55 125 11.2 340.3
  • 5-10 2516 50.2 109.1 55-60
    107 10.3 350.6
  • 10-15 2157 46.4 155.5 60-65
    82 9.1 359.7
  • 15-20 1581 39.8 195.3 65-70
    50 7.1 366.8
  • 20-25 1142 33.8 229.1 70-75
    39 6.2 373.0
  • 25-30 746 27.3 256.4 75-80
    25 5.0 378.0
  • 30-35 512 22.6 279.0 80-85
    16 4.0 382.0
  • 35-40 376 19.4 298.4 85-90
    19 4.4 386.4
  • 40-45 265 16.3 314.7 90-95
    2 1.4 387.8
  • 45-50 207 14.4 329.1 95-100
    3 1.7 389.5

35
  • Construción de estratos
  • Suponiendo se quiere tener 5 estratos
  • Supuestamente serían F(vfi )/ L 389/5 77.9
  • 77.9 -155.8 -233.7- 311.6 pero los nº más
    cercanos son
  • Estratos
  • 1 2 3 4
    5
  • Ii. 0-5 5-15 15-25 25-45 45-100
  • Fi,vfi 58.9 96.6 73.6 85.6
    74.8

36
  • N1 3464 N2 4673 N32723 N41899 N5676
  • W1 N1/N 3464/134350.26 W24673/134350.35
    W3 0.20 W40.14 W50.05
  • n1 ? n2? n3 ? n4 ?
    n5 ?
  • h Wh Sh WhSh nh W1 N1/N
    3464/134350.26
  • 1 0.26 5 1.30 903
  • 2 0.35 10 3.50 2432
  • 3 0.20 7 1.40 973
  • 4 0.14 5 0.70 486
  • 5 0.05 1 0.05 36
  • Total 1 69.5 4830

37
  • A) por D)Asignación óptima revisada
  • Vmin(ÿst)(SWhSh)² / n) S WhSh² / N (cpf)
  • 0.01 (6.95)²/n ? n 4830
  • b) Por A)Minimizar V(ÿst) para un n total fijo
    (NEYMAN)
  • nh nWhSh / SWhSh nNhSh / SNhSh
  • n14830(1.3)/6.95 903
  • n2 4830(3.5)/6.952432
  • n3 4830(1.4)/6.95 973
  • n4 4830(0.7)/6.95 486
  • n5 4830(0.05)/6.95 36
  • n4830

38
  • VARIABLES ESTADÍSTICAS
  • Es toda característica que se desea estudiar de
    la población y que toma mínimamente dos valores
  • X x1 ,x2,...,xn
  • CLASES DE VARIABLES
  • 1.-CUANTITATIVAS.- Son aquellas que se pueden
    contar o medir,tenemos a) Discreta y b)continuas
  • 2.-CUALITATIVAS.-Son aquellas que guardan algún
    atributo o característica,tenemosa)Nominal y b)
    ordinal

39
  • CICLO METODOLÓGICO

POBLACION (N)
muestreo
MUESTRA (n)
MUESTRA (n)
Estadística descriptiva
Toma de decisiones
Estadística inferencial
40
  • Metodología de la investigación
  • 1.-Planteamiento del problema y de la hipótesis
  • Se define claramente los objetivos del
    estudio,relacionando con los valores numéricos de
    las variables observables(y efecto x causa)
  • 2.-Recolección de datos
  • a)Datos publicados,b)diseño experimental
    c)Encuesta
  • 3.-Organización y clasificación de datos
  • se debe realizar un análisis de consistencia
  • 4.-Análisis e interpretación de los datos

41
  • ORGANIZACIÓN DE LOS DATOS
  • Una vez recopilados los datos ,éstos se los deben
    presentar en
  • 1.-Cuadros estadísticos.-que deben tener
  • a) Título descriptivo y numerado(superior)
  • b) Fuente de los datos(pie de página)
  • c) Unidades en que se expresan
  • 2 .-Gráficos
  • a) De barras (Verticales u horizontales)
  • b) Circulares

42
  • DISTRIBUCIÓN DE FREC. DE V .CUALITATIVAS
  • Cuadro Nº 1.1. Distrib.de frec. De..........

Categorías X Frecuencias absolutas simples fi Frecuencias relativas hi Porcentajes pi
C1 C2 . . Ck f1 f2 . . fk h1 h2 . . hk p1 p2 . . pk
Totales n 1 100
43
  • Ejemplo.-
  • En una entrevista a 20 alumnos sobre la
    preferencia por tipos de ordenadoresA,B,C,se
    obtuvieron los siguientes resultado
  • A,B,B,A,C,B,B,A,A,B,A,B,B,C,A,B,A,C,A,B,
    Cuadro nº 1.2.Distrib.de alumnos por pref.de pc

Tipo de PC X fi hi pi
A 8 0.40 40
B 9 0.45 45
C 3 0.15 15
Totales 20 1.00 100
44

Figura Nº gráfica de barras
45
  • Distribución de frec.de v.cuantitativas discretas

Valores X fi hi pi
x1 f1 h1 p1
x2 f2 h2 p2
. . . . . . . .
xk fk hk pk
Totales n 1.00 100
Valores X fi hi pi
x1 f1 h1 p1
x2 f2 h2 p2
. . . . . . . .
xk fk hk pk
Totales n 1.00 100
46
  • Distrib.de frec. por Intervalos o clases (ngt30)
  • Cuadro Nº.. Distrib. de frec. por intérvalos

Intérvalos Ii Xi fi hi pi
I1 X1 f1 h1 p1
I2 X2 f2 h2 p2
. . . . . . . . . .
Ik Xk fk hk pk
Totales n 1.00 100
47
  • Procedimiento ordenar los datos y determinar
  • 1.-El alcance (A) AValor Mínimo,Valor
    Máximo
  • 2.-El Rango (R) RValor Máx-valor Mín
  • 3.-Nº de Intérvalos (k)
  • a) 5 lt k lt 20
  • b) k13.3 log(n)
  • 4.-Ancho de clase (wi) WiL i 1 -Li
  • igual ancho W R/k
  • 5.-Marca de clase Xi (Li Li1)/2

48
  • Ejemplo.- se tiene los ingresos quincenales en
    us(X) de 45 familias
  • 63 89 36 49 56 64 59 35 78
  • 43 53 70 57 62 43 68 62 26
  • 64 72 52 51 62 60 71 61 55
  • 59 60 67 57 67 61 67 51 81
  • 53 54 76 44 73 56 62 63 60
  • Se pide clasificar en 8 clases

49
  • Cuadro Nº... Distrib.de frec.de los ingresos de
    45 familias en dólares

Ii Xi fi hi pi
26,34gt 34,42gt 42,50gt 50,58gt 58,66gt 66,74gt 74,82gt 82,90gt 30 38 46 54 62 70 78 86 1 2 4 10 16 8 3 1 0.022 0.044 0.089 0.222 0.356 0.178 0.067 0.022 2.2 4.4 8.9 22.2 35.6 17.8 6.7 2.2
totales 45 1.000 100
50
  • Histograma de los ingresos de 45 familias

fi
xi
51
  • Frecuencia absoluta simple fi
  • Es el Nº de datos observados en cada categoría
  • Tal que Sfi n
  • Frecuencia relativa simple hi
  • Es la proporción por cada categoría .
  • Tal que hi fi/n Shi 1
  • Porcentaje pi
  • Es el tanto por ciento de cada categoría
  • Tal que pi 100hi Spi 100
  • Frecuencia Abs.acumulada Fi
  • Nº de obs.menores que el límite superior de
    determinada clase
  • Tal que F1f1 Fi F i-1fi
  • Frecuencia Relativa acumulada Hi
  • Es la proporción menor al límite superior de
    determinada clase
  • Tal que Hi hi , Hi Hi-1 hi Hi
    Fi/n i1,2,3,....k

52
  • TEMA Nº 3 MEDIDAS DE POSICIÓN
  • TenemosLa media , la media geométrica
    armónica, cuadrática , la mediana,la moda,los
    cuantiles
  • La media aritmética
  • a) Para datos no clasificados
  • poblacional µ S Xi/N muestral X Sxi/n
  • b)Para datos clasificados
  • poblacional µ S (xi fi)/Nmuestral X S
    (xi fi)/n
  • Del Ej. De los ingresos de 45 familias ,el
    ingreso medio ó percápita es X S (xi fi)/n
    2702/45
  • X 60,04 us semanal

53
  • Propiedades de la media aritmética
  • Sean a,b,c, constantes x,y variables
  • 1.- M( c ) C
  • 2.- M( x c ) M( x ) c
  • 3.- M( ax ) a M( x )
  • 4.- M ( ax b) aM( x ) b
  • 5.- M x M( x ) 0

54
  • La Mediana- Xm ó Md
  • 1.-Para datos no clasificados,una vez ordenado,la
    mediana es
  • a) Cuando n es impar es el valor central
  • b) Cuando n es par es el promedio de los dos
    valores centrales
  • 2.-Para datos clasificados
  • Xm Lm Wm n/2 F m-1 / fm, donde
  • la clase mediana se obtiene.
  • Fm ? n/2 ? Im Lm ,Lmi 1gt

55
  • LA MODA Xmo Ó Mo.-para datos clasificado
  • Mo Li Wi ?1 / (?1 ?2 ) ?1 fi fi-1
    ?2 fi fi 1
  • Ej se tiene la siguiente distribución de
    frecuencias de alturas (pulg ) de 100 personas
  • Hallar a) La media,b)La Mediana c) la Moda

Ii Xi fi Fi Xi fi (xi-67.95)²fi
60-63 63-66 66-69 69-72 72-75 61.5 64.5 67.5 70.5 73.5 5 18 42 27 8 5 23 65 92 100 307.5 1161.0 2835.0 1903.5 588.0 208.0125 214.2450 8.5050 175.5675 2.46.4200
total 100 6795.0 852.7500
56
  • Solución
  • a)la media X 6795 / 100 67,95 pulg
  • b)La mediana Xm 66350-23 / 42 67.90 pulg
  • c)La moda Mo 66324 / (2415 67.8
    pulg
  • Media geométrica .-(G)se utiliza cuando el
    conjunto es una P.G. Porcentajes.índices etc..
  • Media armónica (H) .- se utiliza cuando el
    conjunto es un P.A., tasas, muestra pequeña etc.

57
  • Tema nº 4 MEDIDAS DE DISPERSIÓN
  • 1.-La varianza V(X)
  • Def gral. V(X) E (x x )²
  • a) Datos no clasificados
  • S² S (xi x)² / n-1
  • b) datos clasificados
  • S² S (xi x)² fi / n-1
  • 2.-La desviación típica s
  • s V(x)
  • 3.- Coeficiente de variación CV
  • CV S / x 100

58
  • Ej. De la anterior distribución hallar a) la
    varianza b) la desviación c) el coeficiente de
    variación.
  • Solución
  • a) La varianza
  • S² 852.75 / 100 8.5275 pulg ²
  • b) La desviación típica
  • S 8.5275 pulg² 2.92 pulg
  • c) El cv ( 2.92 / 76.95 ) 100 4.30

59
  • Propiedades de la Varianza
  • Sean a,b,c constantes, XY variables
  • 1.-V( c ) 0
  • 2.-V (X c) V(X)
  • 3.-V( aX ) a² V (X)
  • 4.-V(aX b) a² v(X)
  • 5.-V(X)M(x²) M(x) ² donde
  • M(x²) ?xi² /n, para datos no clasificados
  • M(x²) ?xi²fi / n,para datos clasificados

60
  • Momentos.- Definición Gral E (x-a) r
    1,2,3,..
  • a) Momentos originales si a0
  • mr E x S xi fi / n
  • b) Momentos centrales si a x
  • m r E (xi-x) S( xi-x)fi / n r
    1,2,3....
  • Coeficiente de asimetría
  • Sk ( x Mo) / s , si Sk gt 0 sesgado a
    la derecha

  • Sk lt 0 sesgado a la izquierda

  • Sk 0 simétrico
  • Coeficiente de Kurtosis
  • Cx ?4 / (?²)² si Cx gt0 ?
    leptocúrtico

  • si Cx lt0 ? platicúrtico
  • si Cx 0 ?
    mesocúrtico

61
  • Tema nº 5 REGRESIÓN LINEAL SIMPLE
  • V.E.Bidimensional (X,Y)
  • -La regresión surge en el análisis de la forma
    funcional entre X (causa) ,Y(efecto)
  • -La correlación surge en el análisis de
    asociación entre X ,Y
  • - Diagrama de dispersión .- es el gráfico de
    los pares (xy) ,que da la pauta de la forma
    funcional entre X e Y
  • - La covarianza mide el grado de dispersión
    conjunta entre X ,Y
  • Coeficiente de correlación r.-mide el grado de
    asociación lineal entre X e Y
  • -1lt r lt 1

62
  • Regresión lineal simple .- Y a bX ,consiste
    en estimar la ec.de la recta con el fin de
    predecir o estimar Y (dependiente) a partir de x(
    independiente)
  • Donde a intercepto b pendiente o coeficiente
    de regresión
  • Estimación mediante los MCO
  • Y â b X donde b n Sxiyi SxiSyi /
    nSx²-(Sx)²
  • â y b x
  • si bgt0 la tendencia lineal es creciente
  • si blt0 la tendencia lineal es decreciente
  • si b0 no hay regresión por que Y a

63
  • Ejemplo.-
  • En un estudio de la relación entre la
    publicidad por tv y las ventas de ordenadores
    durante 10 semanas se han recopilado los tiempos
    de duración en minutos de publicidad por semana
    (X) y el nº de ordenadores vendidos(y) siendo
  • Semana 1 2 3 4 5 6 7
    8 9 10
  • Publicidad(X) 20 30 30 40 50 60 60 60
    70 80
  • Ventas(Y) 50 73 69 87 108 128 135 132 148
    170
  • a)Estimar la recta de regresión ,b) el r c)
    Estime las ventas si la publicidad es de 90
    minutos

64
  • Solución
  • Cuadro Nº ...

x y xy X² Y²
20 30 30 40 50 60 60 60 70 80 50 73 69 87 108 128 135 132 148 170 1000 2190 2070 3480 5400 7680 8100 7920 10360 13600 400 900 900 1600 2500 3600 3600 3600 4900 6400 2500 5329 4761 7569 11664 16384 18225 17424 21904 28900
500 1100 61800 28400 134660
65
  • SOLUCIÓN
  • b10(61800)-500(11009 / 10(28400)-500²
  • b 68000 / 34002 b2
  • a 110- 2(50) 10 a10
  • Por lo tanto y 10 2 X
  • b) El r n Sxiyi SxiSyi / nSx²-(Sx)²
    nSy²-(Sy)²
  • 680 /681.5424 0.998 , r0.998 altamente
    positivo
  • c) Estimación para x70 y 10 2 (90) 190
    ordenadores
Write a Comment
User Comments (0)
About PowerShow.com