Estad - PowerPoint PPT Presentation

1 / 32
About This Presentation
Title:

Estad

Description:

Las magnitudes m y s2 son par metros fijos y desconocidos de la poblaci n. Las magnitudes x y s2 son variables aleatorias conocidas de la muestra. ... – PowerPoint PPT presentation

Number of Views:127
Avg rating:3.0/5.0
Slides: 33
Provided by: Fed132
Category:
Tags: estad | magnitudes

less

Transcript and Presenter's Notes

Title: Estad


1
EstadísticaMaestría en FinanzasMercado de
Capitales
  • Alberto Landro
  • Pablo M. Federico

Pablo M. Federico Clase 4
2
Clase 4
  • Inferencia Estadística e Intervalos de Confianza

Pablo M. Federico Clase 3
3
1. Inferencia estadística
  • Dado una conjunto de N elementos (denominado
    población) donde cada elemento está identificado
    por un índice k y tiene asociado un atributo
    numérico de valor xk.
  • Si dispusiéramos de todos los valores xk
    (censo), podríamos calcular ciertos parámetros
    como la media o la varianza de la población.
  • Obtener todos los valores xk es muy costoso.
    Entonces tratamos de inferir el valor de ciertos
    parámetros de la población a partir de n valores
    de xk (una muestra de tamaño n).

Pablo M. Federico Clase 4
4
1. Inferencia estadística
  • Existen 3 técnicas básicas dentro de la
    inferencia estadística clásica
  • 1. Estimación puntual.
  • 2. Estimación por intervalos.
  • 3. Test de hipótesis.
  • Dichas técnicas nos ayudarán en nuestro objetivo
    último, el cual es obtener conclusiones sobre
    determinados parámetros
  • poblacionales (valores fijos y únicos).

Pablo M. Federico Clase 4
5
1. Inferencia estadística
  • Las magnitudes m y s2 son parámetros fijos y
    desconocidos de la población.
  • Las magnitudes x y s2 son variables aleatorias
    conocidas de la muestra.
  • Tratamos de inferir valores de los parámetros a
    partir de la muestra.
  • Los valores xk de la población determinan la
    distribución de la población, con media es m, con
    varianza es s2.
  • Las variables aleatorias x y s2 tienen
    distribuciones de muestreo.

Pablo M. Federico Clase 4
6
1. Inferencia estadística
  • Teorema central del límite A pesar de que las
    distribuciones de la población y de muestreo son
    diferentes existe una relación entre ellas.
  • La distribución de las medias muestrales tiende
    a una normal, aunque la distribución de la
    población de la que provienen las muestras no sea
    normal.
  • Como el teorema del límite central nos dice que
    la media muestral (x) tiene distribución normal,
    basta con conocer la media y la varianza para
    poder calcular probabilidades.
  • Pero como la media muestral (x) es un promedio
    ponderado de variables aleatorias conocemos la
    media y la varianza de x.

Pablo M. Federico Clase 4
7
1. Intervalos de Confianza
  • Dado que y
  • Como x tiene una distribución normal, tenemos una
    certeza del 68 que x se encuentra en el
    intervalo
  • La certeza depende de la cantidad de
    desviaciones alrededor de la media.
  • En general

Pablo M. Federico Clase 3
8
1. Intervalos de Confianza
  • Como no conocemos m no podemos evaluar el
    intervalo.
  • Cambiamos de marco de referencia nos centramos
    en el x en lugar de basarnos en m.
  • Al cambiar el marco de referencia suponemos que x
    es fijo y que m varía normalmente alrededor de x.

Pablo M. Federico Clase 4
9
1. Intervalos de Confianza
  • Veamos un ejemplo. Supongamos que deseamos
    construir un intervalo de confianza para la media
    poblacional m, cuando se muestrea una
    distribución normal con varianza conocida.
  • Sea x1...xn una sucesión de variables
    aleatorias independientes e igualmente
    distribuidas (i.i.d.), en donde
  • Mi primer objetivo será encontrar el estadístico.
    A priori, sabemos que es un estimador
    consistente (eficiente e insesgado) de m, en
    donde
  • y donde y por tanto

Pablo M. Federico Clase 4
10
1. Intervalos de Confianza
  • Esta última expresión no es más que el
    estadístico que estoy buscando, cuya distribución
    conozco.

Pablo M. Federico Clase 4
11
1. Intervalos de Confianza
Despejando m En particular, cuando
reemplace por los valores muestrales, a y b
adoptarán la forma de números, dejando de ser
extremos aleatorios (y empezamos a hablar de
confiabilidad, no probabilidad). Por ejemplo
Suponiendo que a 5, el anterior intervalo
contendrá a m con un 95 de confiabilidad (no
probabilidad). El 95 significa que de cada 100
intervalos que calcule, sólo 5 como máximo no
contendrán al párametro m.
Pablo M. Federico Clase 4
12
1. Intervalos de Confianza
  • Veamos un ejemplo numérico Supongamos que se
    desea estimar el promedio de las estaturas de
    todos los habitantes hombres de mas de 25 años de
    la Ciudad de Buenos Aires. Para ello, se toma una
    muestra de 100 personas. Asimismo, se sabe que la
    dispersión es igual a 8 cm. De la muestra de 100
    personas, se sabe que la estatura promedio es de
    172,3 cm. Supongamos que deseamos calcular un
    intervalo de confianza para la media poblacional
    con un nivel de confianza del 95. Si se sabe que
    las estaturas se distribuyen normalmente,
    podremos utilizar el estadístico que recién hemos
    obtenido, por lo que, luego de despejar
  • Reemplazamos por los datos
  • 172.3-(1.968/10) m 172.3(1.968/10)0.95
  • C(170.732 m 173.868)0.95

Pablo M. Federico Clase 4
13
1. Intervalos de Confianza
  • Longitud del intervalo (L) en nuestro ejemplo la
    longitud del intervalo de confianza sería
  • Y numéricamente sería L173.868-170.7323.136
  • Por lo que
  • igual a 21.968/103.136

Pablo M. Federico Clase 4
14
1. Intervalos de Confianza
  • Mayor seguridad se logrará entonces a partir de
    una mayor longitud del intervalo. Por ejemplo, si
    deseo que la seguridad de mi estimación sea del
    99
  • 172,3 - 2,58 . 8/10 m 172,3 2,58 . 8/10
    0,99
  • C170,236 m 174,364 0,99
  • L / (1 - a) 95 2 . 1,96 . 8/10 3,136
  • L / (1 - a) 99 2 . 2,58 . 8/10 4,128

Pablo M. Federico Clase 4
15
1. Intervalos de Confianza
  • Supongamos que ahora deseo una longitud y una
    seguridad determinada. La única variable con la
    que podré jugar será la cantidad de
    observaciones
  • Por ejemplo, en nuestro último ejercicio
    numérico, obtuvimos con n100 y 1- a 99 una L
    4,128. Supongamos que deseamos mantener la
    seguridad al tiempo que reducimos la longitud a
    solo 2 cm.
  • Por lo tanto, deberé aumentar mi muestra en 327
    observaciones, a fin de cumplir con lo requerido
    ya que
  • n(42.58264)/4426.2

Pablo M. Federico Clase 4
16
1. Intervalos de Confianza
  • Supongamos ahora que deseamos construir un
    intervalo de confianza para la media poblacional
    m, cuando se muestrea una distribución normal con
    varianza desconocida. Sean x1...xn una sucesión
    de variables aleatorias independientes e
    igualmente distribuidas (i.i.d.), en donde
    xiN(m s2).
  • Mi primer objetivo será encontrar el estadístico
    . A priori, se que es un estimador consistente
    (eficiente e insesgado) de m, en donde
  • y en donde aunque ahora desconozco s

Pablo M. Federico Clase 4
17
1. Intervalos de Confianza
  • Sin embargo, puede demostrarse que S2 es un
    estimador insesgado de s2, siendo
  • Puede demostrarse entonces que
  • Y por lo tanto

Pablo M. Federico Clase 4
18
1. Intervalos de Confianza
  • Volvamos a nuestro ejemplo numérico pero
    supongamos que desconocemos s2 (aunque conocemos
    S 8,7) y que se toma una muestra de 20 personas
    en lugar de 100 (es decir, ahora n20).
    Reemplazando en 2 , obtendremos
  • 172.3 t-teórico 8.7/4.472 m 172.3
    t-teórico 8.7/4.472
  • 172.3 2.093 8.7/4.472 m 172.3 2.093
    8.7/4.472
  • C(167.57 m 177.03) 0.95
  • Ahora bien, puede demostrarse asimismo que si n
    tiende a
  • infinito entonces
  • Y, por lo tanto

Pablo M. Federico Clase 4
19
1. Intervalos de Confianza
  • Supongamos que deseamos ahora realizar un
    intervalo de confianza para la varianza
    poblacional. Puede demostrarse que

Pablo M. Federico Clase 4
20
1. Intervalos de Confianza
  • Veamos un ejemplo numérico. Supongamos que se
    toma una muestra de 27 focos de luz. Supongamos
    que S2 98 horas. Si se supone que la duración
    de esos focos sigue una distribución normal,
    busquemos un intervalo con el 90 de confianza
    para la desviación estándar poblacional de la
    duración de esos focos.
  • Reemplazando en la ecuación anterior por los
    datos dados, obtenemos entonces que

Pablo M. Federico Clase 4
21
1. Intervalos de Confianza
  • Supongamos ahora que deseo saber entre que
    valores se encuentra la diferencia entre dos
    medias poblacionales. Partamos entonces de los
    siguientes supuestos
  • Sea x1...xn una sucesión de variables
    aleatorias independientes e igualmente
    distribuidas (i.i.d.), en donde xiN(mx s2x).
  • Sea y1...yn una sucesión de variables
    aleatorias independientes e igualmente
    distribuidas (i.i.d.), en donde yiN(my s2y).
  • Siendo las xi independientes de las yi por lo que
    la covarianza entre ambas es igual a 0, se
    verifica que

Pablo M. Federico Clase 4
22
1. Intervalos de Confianza
  • Si suponemos que sxsys y conocidas,
  • Por lo que,

Pablo M. Federico Clase 4
23
1. Intervalos de Confianza
  • Si en cambio desconocemos s2x y s2y aunque
    sabemos que son iguales
  • en donde,
  • Y nuevamente puede demostrarse que si n tiende a
    infinito,

Pablo M. Federico Clase 4
24
1. Intervalos de Confianza
  • Por último supongamos ahora que
  • Sea x1...xn una sucesión de variables
    aleatorias independientes e igualmente
    distribuidas (i.i.d.), en donde xi posee
    cualquier distribución y nx tiende a 8
  • Sea y1...yn una sucesión de variables
    aleatorias independientes e igualmente
    distribuidas (i.i.d.), en donde yi posee
    cualquier distribución y ny tiende a 8
  • Por lo tanto, razonando de igual forma que antes
  • Si desconocemos las varianzas,

Pablo M. Federico Clase 4
25
1. Intervalos de Confianza
  • SINTESIS
  • Si deseamos realizar un intervalo de confianza
    para la media poblacional, con s conocido,
    deberemos usar la expresión 1.
  • Si deseamos realizar un intervalo de confianza
    para la media poblacional, con s desconocido,
    deberemos usar la expresión 2.
  • Aunque, si n es suficientemente grande, puede
    utilizarse la expresión 3
  • Si deseamos realizar un intervalo de confianza
    para la varianza poblacional, deberemos usar la
    expresión 4
  • Si deseamos realizar un intervalo de confianza
    para la diferencia de medias poblacionales, con
    ambos s conocidos e iguales, deberemos usar la
    expresión 5

Pablo M. Federico Clase 4
26
1. Intervalos de Confianza
Si deseamos realizar un intervalo de confianza
para la diferencia de medias poblacionales, con
ambos s desconocidos e iguales, deberemos usar la
expresión 6 donde S será igual a 7 Si
deseamos realizar un intervalo de confianza para
la diferencia de medias poblacionales, con ambos
s conocidos y distintos, y en donde las xi y las
yi poseen cualquier distribución de
probabilidades, deberemos usar la expresión 8
Si deseamos realizar un intervalo de confianza
para la diferencia de medias poblacionales, con
ambos s desconocidos y distintos, y en donde las
xi y las yi poseen cualquier distribución de
probabilidades, deberemos usar la expresión 9
Pablo M. Federico Clase 4
27
1. Intervalos de Confianza
Ejercicios Ej 1. Un fabricante de fibras
sintéticas desea estimar la tensión de ruptura
media de una fibra. Diseña un experimento en el
que se observan las tensiones de ruptura, en
libras, de 16 hilos del proceso seleccionados
aleatoriamente. Las tensiones son 20,8 20,6
21,0 20,9 19,9 20,2 19,8 19,6 20,9
21,1 20,4 20,6 19,7 19,6 20,3 y 20,7.
Supóngase que la tensión de ruptura de una
fibra se encuentra modelada por una distribución
normal con desviación estándar de 0,45 libras.
Construir un intervalo de confianza estimado del
98 para el valor real de la tensión de ruptura
promedio de la fibra.
Pablo M. Federico Clase 4
28
1. Intervalos de Confianza
Ej 2. La Cámara de Comercio de Buenos Aires se
encuentra interesada en estimar la cantidad
promedio de dinero que gasta la gente que asiste
a convenciones calculando comidas, alojamiento y
entretenimiento por día. De las distintas
convenciones que se llevan a cabo en la ciudad,
se seleccionaron 16 personas y se les preguntó la
cantidad que gastaban por día. Se obtuvo la
siguiente información en ARS 150, 175, 163, 148,
142, 189, 135, 174, 168, 152, 158, 184, 134, 146,
155, 163. Si se supone que la cantidad de dinero
gastada en un día es una variable aleatoria
distribuida normalmente, obtener los intervalos
de confianza estimados del 90, 95 y 98 para la
cantidad promedio real.
Pablo M. Federico Clase 4
29
1. Intervalos de Confianza
Ej 3. Dos universidades financiadas por el
gobierno tienen métodos distintos para inscribir
a sus alumnos a principios de cada semestre. Las
dos desean comparar el tiempo promedio que les
toma a los estudiantes completar el trámite de
inscripción. En cada universidad se anotaron los
tiempos de inscripción para 100 alumnos
seleccionados al azar. Las medias y las
desviaciones estándares muestrales son las
siguientes Media Universidad x 50,2 Desvío
Universidad x (Sx) 4,8 Media Universidad y
52,9 Desvío Universidad y (Sy) 5,4 Si se supone
que el muestreo se llevo a cabo sobre dos
poblaciones distribuidas normalmente e
independientes, obtener los intervalos de
confianza estimados del 90, 95 y 99 para la
diferencia de las medias del tiempo de
inscripción para las dos Universidades.
Pablo M. Federico Clase 4
30
1. Intervalos de Confianza
Ej 4. En dos ciudades se llevó a cabo una
encuesta sobre el costo de vida para obtener el
gasto promedio en alimentación en familias
constituidas por cuatro personas. De cada ciudad
se seleccionó aleatoriamente una muestra de 20
familias y se observaron sus gastos semanales de
alimentación. Las medias y las desviaciones
estándares muestrales fueron las
siguientes Media muestral ciudad x 135 Desvío
muestral ciudad x (Sx) 15 Media muestral ciudad
y 122 Desvío muestral ciudad y (Sy) 10 Si se
supone que se muestrearon dos poblaciones
independientes condistribución normal cada una y
varianzas iguales, obtener los intervalosde
confianza estimados del 95 y 99 para la
diferencia de medias poblacionales.
Pablo M. Federico Clase 4
31
1. Intervalos de Confianza
Ej 5. Mediante el uso de los datos del ejercicio
2 obtener un intervalo de confianza estimado del
95 para la varianza poblacional.
Pablo M. Federico Clase 4
32
  • Fin

Me pueden contactar en pablofeder_at_gmail.com Las
presentaciones estan colgadas en www.cema.edu.ar/
u/pmf03
Pablo M. Federico 21 de Marzo de 2007
Write a Comment
User Comments (0)
About PowerShow.com