Title: Estad
1EstadísticaMaestría en FinanzasMercado de
Capitales
- Alberto Landro
- Pablo M. Federico
Pablo M. Federico Clase 4
2Clase 4
- Inferencia Estadística e Intervalos de Confianza
Pablo M. Federico Clase 3
31. Inferencia estadística
- Dado una conjunto de N elementos (denominado
población) donde cada elemento está identificado
por un índice k y tiene asociado un atributo
numérico de valor xk. - Si dispusiéramos de todos los valores xk
(censo), podríamos calcular ciertos parámetros
como la media o la varianza de la población. - Obtener todos los valores xk es muy costoso.
Entonces tratamos de inferir el valor de ciertos
parámetros de la población a partir de n valores
de xk (una muestra de tamaño n).
Pablo M. Federico Clase 4
41. Inferencia estadística
- Existen 3 técnicas básicas dentro de la
inferencia estadística clásica - 1. Estimación puntual.
- 2. Estimación por intervalos.
- 3. Test de hipótesis.
- Dichas técnicas nos ayudarán en nuestro objetivo
último, el cual es obtener conclusiones sobre
determinados parámetros - poblacionales (valores fijos y únicos).
Pablo M. Federico Clase 4
51. Inferencia estadística
- Las magnitudes m y s2 son parámetros fijos y
desconocidos de la población. - Las magnitudes x y s2 son variables aleatorias
conocidas de la muestra. - Tratamos de inferir valores de los parámetros a
partir de la muestra. - Los valores xk de la población determinan la
distribución de la población, con media es m, con
varianza es s2. - Las variables aleatorias x y s2 tienen
distribuciones de muestreo.
Pablo M. Federico Clase 4
61. Inferencia estadística
- Teorema central del límite A pesar de que las
distribuciones de la población y de muestreo son
diferentes existe una relación entre ellas. - La distribución de las medias muestrales tiende
a una normal, aunque la distribución de la
población de la que provienen las muestras no sea
normal. - Como el teorema del límite central nos dice que
la media muestral (x) tiene distribución normal,
basta con conocer la media y la varianza para
poder calcular probabilidades. - Pero como la media muestral (x) es un promedio
ponderado de variables aleatorias conocemos la
media y la varianza de x.
Pablo M. Federico Clase 4
71. Intervalos de Confianza
- Dado que y
- Como x tiene una distribución normal, tenemos una
certeza del 68 que x se encuentra en el
intervalo -
- La certeza depende de la cantidad de
desviaciones alrededor de la media. - En general
Pablo M. Federico Clase 3
81. Intervalos de Confianza
- Como no conocemos m no podemos evaluar el
intervalo. -
- Cambiamos de marco de referencia nos centramos
en el x en lugar de basarnos en m. - Al cambiar el marco de referencia suponemos que x
es fijo y que m varía normalmente alrededor de x.
Pablo M. Federico Clase 4
91. Intervalos de Confianza
- Veamos un ejemplo. Supongamos que deseamos
construir un intervalo de confianza para la media
poblacional m, cuando se muestrea una
distribución normal con varianza conocida. - Sea x1...xn una sucesión de variables
aleatorias independientes e igualmente
distribuidas (i.i.d.), en donde - Mi primer objetivo será encontrar el estadístico.
A priori, sabemos que es un estimador
consistente (eficiente e insesgado) de m, en
donde - y donde y por tanto
Pablo M. Federico Clase 4
101. Intervalos de Confianza
- Esta última expresión no es más que el
estadístico que estoy buscando, cuya distribución
conozco.
Pablo M. Federico Clase 4
111. Intervalos de Confianza
Despejando m En particular, cuando
reemplace por los valores muestrales, a y b
adoptarán la forma de números, dejando de ser
extremos aleatorios (y empezamos a hablar de
confiabilidad, no probabilidad). Por ejemplo
Suponiendo que a 5, el anterior intervalo
contendrá a m con un 95 de confiabilidad (no
probabilidad). El 95 significa que de cada 100
intervalos que calcule, sólo 5 como máximo no
contendrán al párametro m.
Pablo M. Federico Clase 4
121. Intervalos de Confianza
- Veamos un ejemplo numérico Supongamos que se
desea estimar el promedio de las estaturas de
todos los habitantes hombres de mas de 25 años de
la Ciudad de Buenos Aires. Para ello, se toma una
muestra de 100 personas. Asimismo, se sabe que la
dispersión es igual a 8 cm. De la muestra de 100
personas, se sabe que la estatura promedio es de
172,3 cm. Supongamos que deseamos calcular un
intervalo de confianza para la media poblacional
con un nivel de confianza del 95. Si se sabe que
las estaturas se distribuyen normalmente,
podremos utilizar el estadístico que recién hemos
obtenido, por lo que, luego de despejar - Reemplazamos por los datos
- 172.3-(1.968/10) m 172.3(1.968/10)0.95
- C(170.732 m 173.868)0.95
Pablo M. Federico Clase 4
131. Intervalos de Confianza
- Longitud del intervalo (L) en nuestro ejemplo la
longitud del intervalo de confianza sería - Y numéricamente sería L173.868-170.7323.136
- Por lo que
-
- igual a 21.968/103.136
Pablo M. Federico Clase 4
141. Intervalos de Confianza
- Mayor seguridad se logrará entonces a partir de
una mayor longitud del intervalo. Por ejemplo, si
deseo que la seguridad de mi estimación sea del
99 - 172,3 - 2,58 . 8/10 m 172,3 2,58 . 8/10
0,99 - C170,236 m 174,364 0,99
- L / (1 - a) 95 2 . 1,96 . 8/10 3,136
- L / (1 - a) 99 2 . 2,58 . 8/10 4,128
Pablo M. Federico Clase 4
151. Intervalos de Confianza
- Supongamos que ahora deseo una longitud y una
seguridad determinada. La única variable con la
que podré jugar será la cantidad de
observaciones - Por ejemplo, en nuestro último ejercicio
numérico, obtuvimos con n100 y 1- a 99 una L
4,128. Supongamos que deseamos mantener la
seguridad al tiempo que reducimos la longitud a
solo 2 cm. - Por lo tanto, deberé aumentar mi muestra en 327
observaciones, a fin de cumplir con lo requerido
ya que - n(42.58264)/4426.2
Pablo M. Federico Clase 4
161. Intervalos de Confianza
- Supongamos ahora que deseamos construir un
intervalo de confianza para la media poblacional
m, cuando se muestrea una distribución normal con
varianza desconocida. Sean x1...xn una sucesión
de variables aleatorias independientes e
igualmente distribuidas (i.i.d.), en donde
xiN(m s2). - Mi primer objetivo será encontrar el estadístico
. A priori, se que es un estimador consistente
(eficiente e insesgado) de m, en donde - y en donde aunque ahora desconozco s
Pablo M. Federico Clase 4
171. Intervalos de Confianza
- Sin embargo, puede demostrarse que S2 es un
estimador insesgado de s2, siendo - Puede demostrarse entonces que
- Y por lo tanto
Pablo M. Federico Clase 4
181. Intervalos de Confianza
- Volvamos a nuestro ejemplo numérico pero
supongamos que desconocemos s2 (aunque conocemos
S 8,7) y que se toma una muestra de 20 personas
en lugar de 100 (es decir, ahora n20).
Reemplazando en 2 , obtendremos - 172.3 t-teórico 8.7/4.472 m 172.3
t-teórico 8.7/4.472 - 172.3 2.093 8.7/4.472 m 172.3 2.093
8.7/4.472 - C(167.57 m 177.03) 0.95
- Ahora bien, puede demostrarse asimismo que si n
tiende a - infinito entonces
- Y, por lo tanto
Pablo M. Federico Clase 4
191. Intervalos de Confianza
- Supongamos que deseamos ahora realizar un
intervalo de confianza para la varianza
poblacional. Puede demostrarse que
Pablo M. Federico Clase 4
201. Intervalos de Confianza
- Veamos un ejemplo numérico. Supongamos que se
toma una muestra de 27 focos de luz. Supongamos
que S2 98 horas. Si se supone que la duración
de esos focos sigue una distribución normal,
busquemos un intervalo con el 90 de confianza
para la desviación estándar poblacional de la
duración de esos focos. - Reemplazando en la ecuación anterior por los
datos dados, obtenemos entonces que
Pablo M. Federico Clase 4
211. Intervalos de Confianza
- Supongamos ahora que deseo saber entre que
valores se encuentra la diferencia entre dos
medias poblacionales. Partamos entonces de los
siguientes supuestos - Sea x1...xn una sucesión de variables
aleatorias independientes e igualmente
distribuidas (i.i.d.), en donde xiN(mx s2x). - Sea y1...yn una sucesión de variables
aleatorias independientes e igualmente
distribuidas (i.i.d.), en donde yiN(my s2y). - Siendo las xi independientes de las yi por lo que
la covarianza entre ambas es igual a 0, se
verifica que
Pablo M. Federico Clase 4
221. Intervalos de Confianza
- Si suponemos que sxsys y conocidas,
- Por lo que,
Pablo M. Federico Clase 4
231. Intervalos de Confianza
- Si en cambio desconocemos s2x y s2y aunque
sabemos que son iguales - en donde,
- Y nuevamente puede demostrarse que si n tiende a
infinito,
Pablo M. Federico Clase 4
241. Intervalos de Confianza
- Por último supongamos ahora que
- Sea x1...xn una sucesión de variables
aleatorias independientes e igualmente
distribuidas (i.i.d.), en donde xi posee
cualquier distribución y nx tiende a 8 - Sea y1...yn una sucesión de variables
aleatorias independientes e igualmente
distribuidas (i.i.d.), en donde yi posee
cualquier distribución y ny tiende a 8 - Por lo tanto, razonando de igual forma que antes
- Si desconocemos las varianzas,
Pablo M. Federico Clase 4
251. Intervalos de Confianza
- SINTESIS
- Si deseamos realizar un intervalo de confianza
para la media poblacional, con s conocido,
deberemos usar la expresión 1. - Si deseamos realizar un intervalo de confianza
para la media poblacional, con s desconocido,
deberemos usar la expresión 2. - Aunque, si n es suficientemente grande, puede
utilizarse la expresión 3 - Si deseamos realizar un intervalo de confianza
para la varianza poblacional, deberemos usar la
expresión 4 - Si deseamos realizar un intervalo de confianza
para la diferencia de medias poblacionales, con
ambos s conocidos e iguales, deberemos usar la
expresión 5
Pablo M. Federico Clase 4
261. Intervalos de Confianza
Si deseamos realizar un intervalo de confianza
para la diferencia de medias poblacionales, con
ambos s desconocidos e iguales, deberemos usar la
expresión 6 donde S será igual a 7 Si
deseamos realizar un intervalo de confianza para
la diferencia de medias poblacionales, con ambos
s conocidos y distintos, y en donde las xi y las
yi poseen cualquier distribución de
probabilidades, deberemos usar la expresión 8
Si deseamos realizar un intervalo de confianza
para la diferencia de medias poblacionales, con
ambos s desconocidos y distintos, y en donde las
xi y las yi poseen cualquier distribución de
probabilidades, deberemos usar la expresión 9
Pablo M. Federico Clase 4
271. Intervalos de Confianza
Ejercicios Ej 1. Un fabricante de fibras
sintéticas desea estimar la tensión de ruptura
media de una fibra. Diseña un experimento en el
que se observan las tensiones de ruptura, en
libras, de 16 hilos del proceso seleccionados
aleatoriamente. Las tensiones son 20,8 20,6
21,0 20,9 19,9 20,2 19,8 19,6 20,9
21,1 20,4 20,6 19,7 19,6 20,3 y 20,7.
Supóngase que la tensión de ruptura de una
fibra se encuentra modelada por una distribución
normal con desviación estándar de 0,45 libras.
Construir un intervalo de confianza estimado del
98 para el valor real de la tensión de ruptura
promedio de la fibra.
Pablo M. Federico Clase 4
281. Intervalos de Confianza
Ej 2. La Cámara de Comercio de Buenos Aires se
encuentra interesada en estimar la cantidad
promedio de dinero que gasta la gente que asiste
a convenciones calculando comidas, alojamiento y
entretenimiento por día. De las distintas
convenciones que se llevan a cabo en la ciudad,
se seleccionaron 16 personas y se les preguntó la
cantidad que gastaban por día. Se obtuvo la
siguiente información en ARS 150, 175, 163, 148,
142, 189, 135, 174, 168, 152, 158, 184, 134, 146,
155, 163. Si se supone que la cantidad de dinero
gastada en un día es una variable aleatoria
distribuida normalmente, obtener los intervalos
de confianza estimados del 90, 95 y 98 para la
cantidad promedio real.
Pablo M. Federico Clase 4
291. Intervalos de Confianza
Ej 3. Dos universidades financiadas por el
gobierno tienen métodos distintos para inscribir
a sus alumnos a principios de cada semestre. Las
dos desean comparar el tiempo promedio que les
toma a los estudiantes completar el trámite de
inscripción. En cada universidad se anotaron los
tiempos de inscripción para 100 alumnos
seleccionados al azar. Las medias y las
desviaciones estándares muestrales son las
siguientes Media Universidad x 50,2 Desvío
Universidad x (Sx) 4,8 Media Universidad y
52,9 Desvío Universidad y (Sy) 5,4 Si se supone
que el muestreo se llevo a cabo sobre dos
poblaciones distribuidas normalmente e
independientes, obtener los intervalos de
confianza estimados del 90, 95 y 99 para la
diferencia de las medias del tiempo de
inscripción para las dos Universidades.
Pablo M. Federico Clase 4
301. Intervalos de Confianza
Ej 4. En dos ciudades se llevó a cabo una
encuesta sobre el costo de vida para obtener el
gasto promedio en alimentación en familias
constituidas por cuatro personas. De cada ciudad
se seleccionó aleatoriamente una muestra de 20
familias y se observaron sus gastos semanales de
alimentación. Las medias y las desviaciones
estándares muestrales fueron las
siguientes Media muestral ciudad x 135 Desvío
muestral ciudad x (Sx) 15 Media muestral ciudad
y 122 Desvío muestral ciudad y (Sy) 10 Si se
supone que se muestrearon dos poblaciones
independientes condistribución normal cada una y
varianzas iguales, obtener los intervalosde
confianza estimados del 95 y 99 para la
diferencia de medias poblacionales.
Pablo M. Federico Clase 4
311. Intervalos de Confianza
Ej 5. Mediante el uso de los datos del ejercicio
2 obtener un intervalo de confianza estimado del
95 para la varianza poblacional.
Pablo M. Federico Clase 4
32Me pueden contactar en pablofeder_at_gmail.com Las
presentaciones estan colgadas en www.cema.edu.ar/
u/pmf03
Pablo M. Federico 21 de Marzo de 2007