Title: Revisi
1Inferencia Estimación Puntual y por Intervalos
Tema 2
2- I keep saying the sexy job in the next ten years
will be statisticians. People think I'm joking,
but who would've guessed that computer engineers
would've been the sexy job of the 1990s? - Hal Varian
- Economista en Jefe de Google
- Enero 2009
3Contenido programático
- Muestreo y Estimación puntual
- La media muestral
- Ley de los Grandes Números
- Teorema central del Límite
- Estimación por Intervalos de confianza
- Distribuciones asociadas a la Normal en el
muestreo
4Qué es Inferencia?
- Objetivo usar datos muestrales
- para extraer información de la
- población
- Estimar parámetros
- Construir intervalos de confianza
- Realizar pruebas acerca de los valores de los
parámetros - Determinar el tipo de distribución que
caracteriza a la población
5MUESTREO ALEATORIO SIMPLE
Representativa de la población
Seleccionar observaciones más convenientes
6MUESTREO ALEATORIO SIMPLE
- Dada una Variable aleatoria X, un conjunto X1,
X2, ...,Xn de variables es una Muestra Aleatoria
Simple (MAS) de X si - Cada Xi tiene la misma distribución que X.
- Las variables X1, X2, ...,Xn son estadísticamente
independientes entre sí.
7MUESTREO ALEATORIO SIMPLE
- No confundir el concepto de muestra como
- Resultado de observar el valor que toman las n
variables X1, X2, ...,Xn en un proceso de
muestreo.
8Muestra
- Las propiedades estadísticas que aquí se estudian
se refieren a la MAS como variable aleatoria
multivariada y no como al conjunto de números
resultantes de la observación de la misma.
9Las variables X1Xn constituyen una muestra
aleatoria de tamaño n de una distribución cuya
media es µ y cuya varianza es s2. En otras
palabras, cada Xi tiene media µ y varianza s2.
10Estadísticos
- Un estadístico es una función de la muestra X1,
X2, ...,Xn. - Constituye una nueva variable aleatoria
construida a partir de la muestra aleatoria
simple. - Es más sencillo operar con él que con la muestra
como tal. - Ejemplos
- Media muestral Máx máximo X1, X2,
...,Xn - Mín mínimo X1, X2, ...,Xn Rango máx
- mín. - Varianza muestral
11Muestreo Estadístico
- Propósito
- Hacer inferencias acerca de la población.
Específicamente - estimar los parámetros (?1, ?2, ...)
desconocidos de la variable aleatoria X que
representa a la población. - Ej. Si la vida de un Venezolano se caracteriza
con una distribución exponencial X(?), - Hallar ? que es su esperanza de vida.
12Cómo se estima?
- Mediante estadísticos adecuados, útiles, cuyas
distribuciones se conocen, como la media
muestral, la varianza muestral, el máximo de la
muestra, etc.. - Supuestos
- El tipo de distribución es conocida
- Los parámetros son desconocidos
13Estimadores
- T es un estimador de ? si es un estadístico que
permite estimar un parámetro ? - Estimación puntual de ? resultado de T calculado
sobre los valores específicos de la muestra
14Estimadores
Proceso de Muestreo
15Propiedades de los estimadores puntuales
16La estimación puntual es similar al proceso de
disparar con una pistola a un blanco o lanzar un
dardo a una diana
17- El estimador es semejante a la pistola
- una estimación en particular, a la bala
- y el parámetro de interés al centro del blanco.
- Sacar una muestra de la población y estimar el
valor del parámetro es equivalente a disparar un
solo tiro al blanco.
18- Suponga que una persona dispara un solo tiro al
blanco y que el tiro da en el centro. - Concluimos que es un excelente tirador?
- Querría usted sostener el blanco mientras se
dispara el segundo tiro? - Evidentemente, no decidiríamos que el hombre es
un tirador experto basados en tan escasa
evidencia.
19Sin embargo, si un millón de tiros sucesivos dan
en el centro del blanco, podríamos tener
suficiente confianza en el tirador para sostener
el blanco en el siguiente tiro. El hecho que se
desea enfatizar es No podemos evaluar la
bondad de un procedimiento de estimación puntual
basándonos en una sola estimación, más bien
debemos observar los resultados y utilizar el
procedimiento de estimación muchas, muchas veces.
20Precisión y Exactitud
Características deseables de un buen estimador
- Precisión que las estimaciones no se dispersen
demasiado - Exactitud que si se realizan numerosos
experimentos el promedio del estadístico sea el
parámetro a estimar.
21Precisión y Exactitud
Varianza
Precisión
Valor esperado
Exactitud
22- T es un estimador insesgado de ? si E(T) ?.
- Supongamos que se tiene un número indefinido de
muestras de una población, todas ellas del mismo
tamaño n. - Sobre cada muestra el estimador nos ofrece una
estimación concreta del parámetro que buscamos. - Pues bien, el estimador es insesgado, si sobre
dicha cantidad indefinida de estimaciones, el
valor medio obtenido en las estimaciones es ?.
23Error Cuadrático Medio(Mean Square Error)
- Si T es un estimador de ?, el MSE es una medida
de dispersión de T respecto de ?. - MSE E(T - ?)2
- Propiedad
- MSE VAR(T) (E( T) - ?)2
24Error Cuadrático Medio(Mean Square Error)
. . . .
. . .
. . .
.
. . . .
. . . .
.
?
25Error Cuadrático Medio(Mean Square Error)
- Insesgado
- T es un estimador insesgado de ? si E(T) ?
- Se entiende por sesgo del estimador a la
diferencia E(T) ? - MSE Var(T) (sesgo)2
- Objetivo minimizar ambos términos varianza y
sesgo
26Insesgados de Varianza Mínima
- T es un estimador insesgado de varianza mínima de
? si es el de menor varianza entre todos los
estimador insesgados.
Insesgado E (T1) E ( T2) ? V (T1) gt V ( T2)
T2
Deseado
27Ejemplo
Sea X1, X2,, X7 una muestra aleatoria de una
población que tiene media µ y varianza s2.
Considere los siguientes estimadores de µ
- Alguno de estos estimadores es insesgado?
- Cuál estimador es el mejor?
28Ejemplo
La lectura de un voltímetro conectado a un
circuito de prueba tiene una distribución
uniforme en el intervalo (?, ?1) en donde ? es
el verdadero pero desconocido voltaje del
circuito. Suponga que Y1, Y2,, Yn es una
muestra aleatoria de tales lecturas.
Demuestre que es un estimador sesgado de ? y
calcule su sesgo.
29Teorema de Chebychev(Tchebisheff, Tchebichev)
Sea X una variable aleatoria. Entonces, para
cualquier kgt0
La desigualdad de Chebychev provee una cota que
no depende de la distribución, sino de la
varianza de X
30PORCENTAJE DE LA DISTRIBUCIÓN MAYOR QUE K
DESVIACIONES ESTÁNDAR A PARTIR DE LA MEDIA
k Regla de Chebychev Distribución normal
1.5 Menor que 44.4 13.4
2 Menor que 25.0 4.6
3 Menor que 11 0.27
4 Menor que 6.3 0.01
La cota que ofrece la desigualdad de Chebychev
puede ser grosera en algunos casos, pero debemos
recordar que la desigualdad sirve para todas las
distribuciones.
31Teorema de Chebychev(Tchebisheff, Tchebichev)
También puede escribirse
µ-e µ µe
32Ejemplo
Si E(X)5 y V(X)100/12. (e4) P(X 5 gt
4) lt ? Si ahora suponemos XU(0,10), cuánto es
la probabilidad?
33Consistencia
- Concentración del estimador en torno a ? a medida
que la muestra crece (cuando la información
aumenta). - Es esta propiedad de consistencia de un estimador
lo que permite conformarse con el valor observado
de un estimador y asumirlo como representativo
del verdadero valor del parámetro ?.
T5
N 5
N 100
34Consistencia
- Tn es un estimador consistente de ? si
- Para todos los valores de ? y donde e es un
número positivo arbitrario.
35(No Transcript)
36Media Muestral
- Sea X de valor esperado µ y desviación estándar
s - y X1, X2, ...,Xn muestra aleatoria simple de X.
- Por las propiedades ya establecidas sobre la suma
de variables aleatorias independientes - E(m) µ
- V(m)s2/n
- Luego, m es un estimador insesgado de µ.
37Media Muestral
De aquí, la media de la media muestral (m) es
igual a la media de la distribución de la cual se
seleccionó la muestra aleatoria, pero la varianza
de m es solo 1/n veces la varianza de esa
distribución.
La distribución de probabilidad de la media
muestral estará más concentrada alrededor del
valor medio µ que la distribución original.
38Concentración de la Media Muestral
- La media muestral tiene el mismo valor
esperado pero está más concentrada en torno a µ,
ya que la desviación estándar disminuye con la
raíz cuadrada de n.
39Varianza Muestral
La varianza muestral
Es un estimador insesgado de s2
40Varianza Muestral
Luego, E(S2) s2
41Varianza Muestral
Observe el denominador
- Es un estimador insesgado de la varianza de la
población, E(S2) V(X) - Es consistente
- No existe un teorema de convergencia como el
teorema central del límite
42Importancia de la Media Muestral
- Su relevancia en la estadística se resume en
dos grandes propiedades - Ley de los Grandes Números
- Teorema Central del Límite
43Ley de los Grandes Números
- La media muestral es un estimador
consistente de µ - La consistencia es el fundamento teórico para la
estimación de la media poblacional por la media
muestral.
44(No Transcript)
45(No Transcript)
46(No Transcript)
47Ley de los Grandes Números
- La Ley de los Grandes Números indica que m se
concentra entorno a µ, pero no indica cómo es la
distribución de la media muestral. El siguiente
teorema tiene ese propósito
48Teorema Central del Límite
- Cuando n ? 8 la distribución de la media
muestral (m) se aproxima a la distribución de una
Normal más precisamente el estadístico de la
media estandarizada
Normal Estándar
49Teorema Central del Límite
- Cuando el tamaño de la muestra crece la
distribución de la muestra se asemeja a la
normal.
50Uso del Teorema Central del Límite
- Cualquiera sea la variable aleatoria X, su media
muestral puede considerarse Normal si el tamaño
muestral (N) es suficientemente grande. - Cuán grande debe ser la muestra?
- X parecida a una Normal ? N 12
- X asimétrica ? N 30
- X muy asimétrica o multimodal ? N 50
51Teorema Central del Límite
52- No todos los estadísticos son asintóticamente
normales, por más grande que sea el N - Cuan grande es el N para que se observe la
tendencia de la media muestral a la distribución
normal, depende de la distribución de la
población.
53Distribución Uniforme
54Distribución Uniforme
55Distribución Exponencial
N15
N30
N50
56Teorema Central del Límite
Suponga que en una población grande de seres
humanos, el diámetro craneal sigue una
distribución aproximadamente normal, con una
media de 185.6 mm y una desviación estándar de 12
mm. Cuál es la probabilidad de que una muestra
aleatoria de tamaño 16 de esta población tenga
una media mayor que 190?
57Teorema Central del Límite
Los resultados de las pruebas de aptitud
académica de todos los alumnos de los liceos de
Maracaibo tiene una media de 60 y una varianza de
64. El valor de la media de una generación
específica de cierto liceo de Mérida con n100
alumnos fue 58 Puede afirmarse que este liceo
tiene peores resultados que los de Maracaibo?
58Teorema Central del Límite
Alumnos de Liceos de Maracaibo
Alumnos de Liceos de Mérida
59Teorema Central del Límite
El Centro de apoyo de Ingeniería y Vivienda del
Ejército de Estados Unidos patrocinó en fechas
recientes un estudio de las características de
confiabilidad, disponibilidad y mantenimiento de
sistemas pequeños que trabajan con diesel y gas
en instalaciones militares y comerciales. El
estudio reveló que el tiempo, x, antes de que sea
necesario dar mantenimiento correctivo a sistemas
diesel auxiliares continuos tiene una
distribución exponencial aproximada con una media
estimada de 1700 horas. Suponiendo µ1700
calcule la probabilidad de que el tiempo medio
antes de dar mantenimiento correctivo a una
muestra de 70 sistemas diesel auxiliares
continuos exceda las 2500 horas.
60Distribución de muestreo de una suma de variables
aleatorias
Si se extrae una muestra aleatoria de n
observaciones, y1, y2, , yn, de una población
con una media finita µ y una varianza s2,
entonces, si n es lo bastante grande, la
distribución de muestreo de la suma
Se puede aproximar con una función de densidad
normal con parámetros
µSnµ y s2S ns2
El estadístico sería
61Distribución de muestreo de una suma de variables
aleatorias
El gerente de Mercadeo de pinturas Montana afirma
que con un galón de pintura se pinta una media de
20 metros, con una varianza de 2. Supongamos que
se desea pintar un área que tiene 630 metros.
Serán suficientes 32 galones? Qué probabilidad
tengo de que no me alcance?
62Distribución de muestreo de una suma de variables
aleatorias
El sueldo mensual promedio de los habitantes de
Venezuela se distribuye uniformemente entre BsF.
500 y BsF. 3.500. Calcule la probabilidad de que
al seleccionar al azar a 100 personas, la suma de
sus sueldos supere los 220 mil bolívares.
63Estimación por Intervalos
- Un estimador proporciona un valor aproximado de
un parámetro ? . Es suficiente? - Cuán próxima es la estimación al parámetro?
- La estimación por intervalos de confianza es
la respuesta.
La estatura media de los estudiantes de
ingeniería es aproximadamente 170 cm.
Estimación puntual
med170 cm
La estatura media de los estudiantes de
ingeniería se encuentra entre 169 y 172 cm
Estimación por intervalos
169 lt µlt172 cm
64Definición
- Si X1, X2, ...,Xn es una MAS de una Variable
X, y se desea estimar ?, un intervalo de
confianza (1-a) es un intervalo inf, sup, que
tiene una probabilidad (1-a) de cubrir al
parámetro ?. - Inf y sup son dos estadísticos de la muestra que
cumplen - Prob (inf ? sup) 1 - a
65Interpretación frecuentista
- Si se toman 100 muestras aleatorias de la
población, y se construye un intervalo de
confianza inf, sup del 95 para cada una de
ellas, se espera que en 95 de ellas el intervalo
contenga al parámetro.
66Interpretación frecuentista
5 rojos 2 blancos
6 rojos 1 blanco
67Generación de intervalos de confianza
- http//davidmlane.com/hyperstat/confidence_interva
ls.html
68Consideraciones Adicionales
- Lo aleatorio es el intervalo inf, sup
- ? es desconocido pero fijo
- El método de construcción es el que posee el
nivel de confianza - Observada la muestra y construido el intervalo
concreto éste contendrá o no al parámetro.
69Consideraciones Adicionales
- No se sabe si el intervalo obtenido con una
muestra en particular contiene o no el verdadero
valor del parámetro, - pero el método utilizado para obtener el
intervalo hace que éste contenga el valor
verdadero el (1 - a) de las veces.
70Intervalos de Confianza de Poblaciones Normales
- De la media con s conocida
- De la media con s desconocida
- De la varianza
71P(Z gt za) a
Cómo se construye un Intervalo de Confianza?
- Si X es N(µ, s2) y tenemos una muestra de tamaño
N, su media muestral m se distribuye también
Normal pero N(µ, s2/N).
Distribución de la estadística
a/2
a/2
-za/2
za/2
72P(Z gt za) a
Despejando la media teórica, nos queda
Esta expresión hace referencia a que, con una
probabilidad de 1-a, el intervalo aleatorio
contendrá el valor de µ.
73Intervalo de confianza para la media, varianza
conocida
Se sabe que la duración, en horas, de un bombillo
de 75 watts tiene una distribución
aproximadamente normal, con una desviación
estándar de 20 horas. Se toma una muestra
aleatoria de 25 bombillos, la cual resulta tener
una duración promedio de 1014 horas. Construya un
intervalo de confianza bilateral del 95 para la
duración promedio de los bombillos.
74Intervalo de confianza para la media, varianza
conocida
Qué observa al construir un intervalo de
confianza bilateral del 99 para la duración
promedio de los bombillos.
75Intervalo de confianza para la media, varianza
conocida
Un equipo de investigadores está interesado en la
puntualidad de los pacientes en las citas
concertadas. En un estudio de flujo de pacientes
en los consultorios de médicos generales se
encontró que una muestra de 35 pacientes llegaba
17,2 minutos tarde a las citas, en promedio. Una
investigación previa había demostrado que la
desviación era de 8 minutos aproximadamente. Se
tuvo la sensación de que la distribución de la
población era normal. Cuál es el intervalo de
confianza de 90 para µ, que es el promedio real
de impuntualidad en las citas?
76Intervalo de confianza para la media, varianza
conocida
- Un fabricante produce anillos para los pistones
de un motor de automóvil. Se sabe que el diámetro
del anillo está distribuido aproximadamente de
manera normal, y que tiene una desviación
estándar s 0,001 mm. Una muestra aleatoria de
15 anillos tiene un diámetro promedio de m
74,036 mm. - Construya el intervalo de confianza bilateral del
99 para el diámetro promedio del anillo.
77Intervalo de Confianza de la Media µ con s
desconocida
- Si se desconoce s, se debe recurrir a la
distribución t de Student - Sea X ? N(µ, s2), X1,.....,Xn una M.A.S., m y
s, media y desviación estándar muestral entonces
el estadístico
es una t con n-1 grados de libertad
78Dada la distribución del estadístico y el nivel
de confianza, se tiene la siguiente igualdad
79- Su aplicación inmediata es que
Es un intervalo de confianza de probabilidad
(1-a) del valor esperado, µ.
80Intervalo de confianza para la media, varianza
desconocida
La dirección médica de una clínica desea estimar
el número promedio de días necesarios para el
tratamiento de pacientes con edades entre 25 y 34
años. Una muestra aleatoria de 500 pacientes de
la clínica con esas edades proporcionó una media
de 5.4 días y una desviación estándar de 3.1
días. Obtenga un intervalo de confianza de 95
para el promedio del tiempo de estancia de la
población de pacientes de la cual se obtuvo la
muestra.
81Intervalo de confianza para la media, varianza
desconocida
Un ingeniero de control de calidad midió el
espesor de la pared de 25 botellas de vidrio de
dos litros. La media muestral es m4.05 mm,
mientras que la desviación estándar muestral es
s0.08 mm. Encuentre un intervalo de confianza
del 90 para la media del espesor de la pared de
las botellas.
82La población tiene una distribución normal?
No
Sí
No
Sí
La muestra es grande?
No
Sí
La muestra es grande?
NP
Se conoce la varianza de la población?
No
Sí
Se conoce la varianza de la población?
Se conoce la varianza de la población?
Sí
No
No
Sí
z
t
t ó z
z
z
t ó z
Se aplica el teorema central del límite
NP Método no paramétrico
83Intervalo de confianza para diferencia de medias,
para observaciones no apareadas
Diferencia entre dos poblaciones
Se toman dos muestras aleatorias independientes
de dos poblaciones de interés. Es decir, la
selección de elementos para una muestra no
afecta, ni es afectada por, la selección de
elementos para la otra muestra. Ej Estudiar la
presión sanguínea en mujeres que toman o no
cierta hormona. Tomamos un grupo de mujeres que
la toman y un grupo de mujeres que no la toman.
84Intervalo de confianza para la diferencia de dos
medias, varianzas conocidas
Desviación de la diferencia muestral
85Intervalo de confianza para la diferencia de dos
medias, varianzas conocidas
Se prueban dos fórmulas diferentes de un
combustible oxigenado para motor en cuanto al
octanaje. La varianza del octanaje para la
fórmula 1 es s211.5 mientras que para la fórmula
2 es s221.2. Se prueban dos muestras aleatorias
de tamaño n115 y n220. Los octanajes promedios
observados son m189.6 y m292.5. Construya un
intervalo de confianza bilateral del 95 para la
diferencia en el octanaje promedio.
86Intervalo de confianza para la diferencia de dos
medias, varianzas conocidas
Se administra dos somníferos A y B a dos grupos
de pacientes en un hospital. El A especifica que
su desviación estándar es 1 hora, mientras el B
especifica 1.5 horas. Si los tamaños muestrales
son n115 y n2 20 para los grupos A y B y las
medias de sueño en esa noche fueron 10 y 9 horas
respectivamente, construya un intervalo de
confianza bilateral del 95 para la diferencia de
horas de sueño entre los somníferos
87Intervalo de confianza para la diferencia de dos
medias, varianzas conocidas
Cuál somnífero concluye usted que es mejor?
De acuerdo al intervalo de confianza, podemos
concluir que el somnífero A produce más sueño que
el B. Es más, se tiene una confianza del 95 que
el somnífero A produce entre 0.17 y 1.83 horas
más de sueño que el somnífero B.
88Intervalo de confianza para la diferencia de dos
medias, varianzas conocidas
Cuál somnífero hubiese concluido usted que
produce mejores resultados si el intervalo de
confianza le hubiese quedado, por ejemplo?
89Intervalo de confianza para la diferencia de dos
medias, varianzas desconocidas
- Se quiere estimar un intervalo de confianza del
95 para la diferencia entre los salarios
iniciales medios de los graduados recientes en
ingeniería mecánica e ingeniería civil de la
Universidad de Florida (UF). Se cuenta con la
siguiente información - Una muestra aleatoria de 59 salarios iniciales
de graduados en ingeniería mecánica de la UF
arrojó una media muestral de 32675 y una
desviación estándar de 4430 - Una muestra aleatoria de 30 salarios iniciales
de - graduados en ingeniería civil de la UF arrojó una
- media muestral de 27460 y una desviación
- estándar de 4286
90Intervalo de confianza para diferencia de medias,
para observaciones no apareadas
Diferencia entre dos poblaciones
Se toman dos muestras aleatorias independientes
de dos poblaciones de interés. Es decir, la
selección de elementos para una muestra no
afecta, ni es afectada por, la selección de
elementos para la otra muestra. Ej Estudiar la
presión sanguínea en dos grupos de mujeres que
toman cierta hormona. Tomamos un grupo de mujeres
que la toman y un grupo de mujeres que no la
toman.
91Intervalo de confianza para diferencia de medias,
para observaciones apareadas
Muestras apareadas
Existen solo n unidades experimentales diferentes
y los datos están recopilados por pares gt cada
unidad experimental está formada por dos
observaciones Ej Estudiar la presión sanguínea
en un grupo de mujeres antes y después de tomar
cierta hormona. (En este ejemplo los datos son
los conjuntos de medidas en las mismas personas).
92Intervalo de confianza para diferencia de medias,
para observaciones apareadas
Un científico de la computación está investigando
la utilidad de dos lenguajes de diseño para
mejorar las tareas de programación. Se pide a
doce programadores expertos, familiarizados con
los dos lenguajes, que codifiquen una función
estándar en ambos lenguajes, anotando el tiempo,
en minutos, que requieren para hacer esta tarea.
Los datos obtenidos son los siguientes
Programador Programador Programador Programador Programador Programador Programador Programador Programador Programador Programador Programador
Sitio 1 2 3 4 5 6 7 8 9 10 11 12
Lenguaje 1 17 16 21 14 18 24 16 14 21 23 13 18
Lenguaje 2 18 14 19 11 23 21 10 13 19 24 15 20
Diferencia -1 2 2 3 -5 3 6 1 2 -1 -2 -2
d 2/3
Encuentre un intervalo de confianza del 95 para
la diferencia en los tiempos de codificación
promedio. Existe algo que indique una
preferencia por alguno de los lenguajes?
93Intervalo de confianza para diferencia de medias,
para observaciones apareadas
El Journal of Environmental Engineering informó
de un modelo de transferencia de calor diseñado
para predecir la pérdida de calor durante el
invierno en clarificadores utilizados para el
tratamiento de aguas de desecho. El análisis
implicó una comparación de la irradiación solar
con cielo despejado sobre superficies en dos
puntos con diferentes latitudes. Se registraron
los niveles de radiación solar durante siete
días. Establezca un intervalo de confianza de 95
para la diferencia media entre los niveles de
irradiación solar de día completo con cielo
despejado en los dos sitios. Interprete los
resultados.
Sitio dia1 dia2 dia3 dia4 dia5 dia6 dia7
St Joseph 782 965 948 1181 1414 1633 1852
Grandes Lagos 593 672 750 988 1226 1462 1698
94Intervalo de Confianza de la Media µ cuando se
conoce s
La estatura media está entre 171 y 173 cm con una
confianza del 95
Precisión
La estatura media está entre 165 y 175 cm con
una confianza del 99
-
95Intervalo de Confianza de la Media µ cuando se
conoce s
- Se puede dar un intervalo con una confianza del
100
Z0,0 8
(-8 , 8)
El peso promedio de los estudiantes de
ingeniería se encuentra entre -8 y 8. Esto es
cierto, pero inútil
96De qué tamaño debo tomar la muestra?
- Cuando se realiza un muestreo ingenuamente se
quiere que la estimación sea - Exacta o al menos muy precisa
- Verdadera o al menos muy confiable
- Barata
97Confiable preciso y barato?
- Cuando se estima µ y s es conocido, el intervalo
de confianza tiene una longitud de
- estableciéndose una relación simple entre
- La confianza (1-a )
- La precisión L
- El tamaño muestral N
98Intervalo de Confianza de la Media µ cuando se
conoce s
- Mayor es la seguridad de que el intervalo
contenga el verdadero valor del parámetro - Menor información se tiene acerca del valor
verdadero - Menor es la precisión
Mientras más grande es la longitud del intervalo
99Tamaño Muestral
- Obsérvese que no se puede fijar arbitrariamente
los 3 números!
1-a
L
Confianza
Precisión
Sólo se pueden fijar 2!
N
Tamaño Muestral
100Tamaño Muestral
- Si se fija precisión (L) y confianza (1-a)
resulta
- Para disminuir el intervalo a la mitad es
necesario cuadriplicar la muestra.
101Determinación del tamaño de la muestra para la
estimación de las medias
Definición
Si xbarra se utiliza como estimación de µ,
entonces puede tenerse una confianza del
100(1-a) de que el error no será mayor que una
cantidad específica E cuando el tamaño de la
muestra sea
102µ
Longitud del intervalo
103µ
Longitud del intervalo (L) 2E
104Intervalo de Confianza de la Media µ cuando se
conoce s
donde
105- Considerando el resto de los parámetros fijos
- Conforme disminuye la longitud del intervalo 2E,
el tamaño requerido de la muestra aumenta. - A medida que aumenta s, el tamaño requerido de la
muestra aumenta. - Conforme aumenta el nivel de confianza, el tamaño
de la muestra aumenta.
106Tamaño Muestral en función de L/sigma
107Determinación del tamaño de la muestra para la
estimación de las medias
Un nutricionista, va a efectuar una encuesta
entre una población de muchachas adolescentes con
el fin de determinar su ingestión diaria promedio
de proteínas, por lo que desea saber qué tamaño
de la muestra debería tomar. Suponga que el
nutricionista quiere un intervalo con una
dimensión de aproximadamente 10 grs., un
intervalo de confianza de .95 y que, con base en
su experiencia previa, sabe que la desviación
estándar de la población es de alrededor de 20
grs.
108Tamaño Muestral
- Qué hacer si s es desconocido?
- No es posible sustituirla por s ya que
depende de m y N - Existe una estimación previa?
- Opinión de expertos confiable?
- Existe una estimación anterior de s con su
intervalo de confianza adecuado?
109Muestreo Preliminar
- Si no se dispone de una estimación anterior de s,
es necesario hacer un muestreo preliminar - Conservador Calcule un intervalo de confianza
de s, (con confianza0,7 por ejemplo) - use su extremo superior como s si desea ser
cauteloso aunque el N obtenido sea grande. - Pragmático Úsese directamente el s muestral
estimado si confía en la estimación preliminar,
corriendo el riesgo de que el N sea subestimado
110Intervalo de confianza para la proporción de una
población
111Intervalo de confianza para la proporción de una
población
Un grupo de investigadores encontró que en una
muestra de 591 pacientes en un hospital
psiquiátrico, 204 pacientes admitieron que
consumieron marihuana al menos una vez durante su
vida. Se pretende construir un intervalo de
confianza de 95 para la proporción de individuos
que consumieron marihuana durante su vida en la
población de internos del hospital.
112Determinación del tamaño de la muestra para la
estimación de proporciones
113Determinación del tamaño de la muestra para la
estimación de proporciones
Se planea realizar una encuesta para determinar
qué proporción de familias en cierta área carece
de servicio médicos. Se cree que la proporción no
puede ser mayor que 0.35. Se desea un intervalo
de confianza del 95 con E 0.05. Cuántas
familias deben encuestarse?
114Intervalo de Confianza de la Varianza
- Cuando se desea estimar la varianza teórica (s2)
a partir de una muestra de tamaño n, se debe
recurrir a la distribución (Ji-cuadrado) con
n-1 grados de libertad - La distribución considera la varianza muestral
S2
Es una con n-1 grados de libertad.
115Intervalo de Confianza de la Varianza
- De la ecuación anterior se deduce que
-
116Intervalo de confianza para la varianza de una
población
117Intervalo de confianza para la varianza de una
distribución normal
Si s2 es la varianza muestral de una muestra
aleatoria de tamaño n, tomada de una
distribución normal con varianza desconocida s2,
entonces, un intervalo de confianza del 100(1-a)
para s2 es
donde X2a/2,n-1 y X21-a/2,n-1 son los puntos
críticos superior e inferior respectivamente que
corresponden a la probabilidad a/2 de la
distribución ji-cuadrada con n-1 grados de
libertad
118Intervalo de confianza para la varianza de una
población
Supuesto
La técnica de estimación se aplica a n tanto
grandes como pequeñas, siempre que se suponga que
la población de la cual se seleccionó la muestra
tiene aproximadamente, una distribución normal.
119Intervalo de confianza para la varianza de una
población
Un supervisor de control de calidad en una
enlatadora sabe que la cantidad exacta contenida
en cada lata varía, pues hay ciertos factores
imposibles de controlar que afectan la cantidad
de llenado. El llenado medio por lata es
importante, pero igualmente importante es la
variación s2 de la cantidad de llenado. Si es
grande algunas latas contendrán muy poco y otras
demasiado. A fin de estimar la variación s2 del
llenado de la enlatadora, el supervisor escoge al
azar 10 latas y pesa el contenido de cada una,
obteniendo los siguientes pesos (en onzas) 7.96
7.90 7.98 8.01 7.97 7.96 8.03 8.02 8.04
8.02 Establezca un intervalo del 90 para la
variación del llenado de las latas
120Intervalo de confianza para la varianza de una
distribución normal
- Se utiliza el término jitter o perturbación
oscilatoria (www.canare.com.hk/
Tech20Notes/Jitter.htm) para describir las
variaciones en el tiempo de conducción de un
sistema de energía modular de agua pulsada. Es
indispensable que el jitter de transferencia sea
bajo para que una tecnología de línea de agua
tenga éxito. Una investigación del jitter de
transferencia en el interruptor de abertura de
plasma de un sistema prototipo produjo para el
tiempo de conducción en n18 pruebas, una media
334.8 nanosegundos y s6.3 nanosegundos . - Establezca un intervalo de confianza de 95 para
la verdadera desviación estándar de los tiempos
de conducción del sistema prototipo. - Se considera que un sistema tiene jitter de
transferencia bajo si la verdadera desviación
estándar del tiempo de conducción es menor que 7
nanosegundos El sistema prototipo satisface este
requisito?
121Intervalo de confianza para la varianza de una
distribución normal
Un fabricante de detergente líquido está
interesado en la uniformidad de la máquina
utilizada para llenar las botellas. De manera
específica, es deseable que la desviación
estándar s del proceso de llenado sea menor que
0.15 onzas de líquido de otro modo, existe un
porcentaje mayor del deseable de botellas con un
contenido menor de detergente. Supóngase que la
distribución del volumen de llenado es
aproximadamente normal. Al tomar una muestra
aleatoria de 20 botellas, se obtiene una
varianza muestral s2 0.0153 (onzas de
líquido)2. Con estos valores podría usted
afirmar que la desviación estándar del proceso
es la deseable? Considere un intervalo superior
de confianza del 95.
Cota de confianza inferior del (1-a)
Cota de confianza superior del (1-a)
122Intervalo de confianza para el cociente de
varianzas de dos distribuciones normales
Comparar varianzas
Se hace inferencia acerca del cociente o razón
s12/s22
123Distribución F
Grados de libertad del numerador
Grados de libertad del denominador
Cociente de dos variables Chi-cuadrada divididas
entre sus grados de libertad
Distribución F con Ny-1 y Nx-1 grados de libertad
124Intervalo de confianza para el cociente de
varianzas de dos distribuciones normales
125Intervalo de confianza para el cociente de
varianzas de dos distribuciones normales
Densidad de la Distribución F con r y s grados de
libertad
126Intervalo de confianza para el cociente de
varianzas de dos distribuciones normales
Si s12 y s22 son las varianzas muestrales de dos
muestras aleatorias de tamaños n1 y n2,
respectivamente, tomadas de dos poblaciones
normales e independientes con varianzas s12 y s22
desconocidas, entonces, un intervalo de confianza
del 100(1-a) para el cociente s12/s22 es
donde fa/2,n2-1,n1-1 y f1-a/2,n2-1,n1-1 son los
puntos críticos superior e inferior que
corresponden al porcentaje a/2 de la distribución
F con n2-1 y n1-1 grados de libertad en el
numerador y denominador, respectivamente.
127Intervalo de confianza para el cociente de
varianzas de dos distribuciones normales
128Intervalo de confianza para el cociente de
varianzas de dos distribuciones normales
Una empresa ha estado experimentando con dos
disposiciones físicas distintas de su línea de
ensamble. A fin de obtener una disposición que
permita un mayor control del proceso, usted
sugiere que se adopte de manera permanente la
disposición que exhiba la varianza más pequeña en
el número de unidades terminadas producidas al
día. Dos muestras aleatorias independientes
producen los siguientes resultados n1 21
días n225 días s12 1.432 s223.761 Establezca
un intervalo de confianza del 95 para s12/s22 ,
la razón de las varianzas del número de unidades
terminadas para las dos disposiciones de línea de
ensamble. Con base en el resultado, cuál de las
dos disposiciones recomendaría usted?
129Intervalo de confianza para el cociente de
varianzas de dos distribuciones normales
Si el intervalo hubiese sido Cuál
hubiese sido su conclusión?
130Distribuciones en el muestreo asociadas a la
Normal
131Distribución T de Student
- Características
- Nexo entre las medias muestral y teórica en una
población normal. - Simétrica, como una normal aplastada
- Cuando los grados de libertad (gl) crecen, la
distribución t tiende a una Normal Estándar. - Si gl gt 30 no se distingue de una normal estándar
132Distribución T de Student
- Parámetros
- gl (Grados de libertad)
- Variable aleatoria
- T
- Valor esperado
- E(X) 0
- Varianza
- V(X) gl/(gl-2) para gl gt 2
- Función de distribución acumulada en el SAS
- PROBT(t,gl)
-
- Inversa
- TINV(p, gl).
133Gráfica Distribución T de Student
134Distribución Ji-Cuadrado
- Características
- Nexo entre las varianzas de la población y la
muestral. - Suma de n Normales estándares elevadas al
cuadrado - Toma valores positivos
- Asimétrica
- Se desplaza a la derecha en función de los grados
de libertad
135Distribución Ji-Cuadrado
- Parámetros
- gl (Grados de libertad)
- Distribución gamma con parámetro de forma
a gl/2 y de escala ? 2. - Valor esperado
- E(X) gl
- Varianza
- V(X) 2gl
- Función de distribución acumulada en el SAS
- PROBCHI(x, gl)
- Inversa
- CINV(p, gl)
- Que es la más útil en el muestreo donde gl
significa grados de libertad.
136 Distribución Ji-Cuadrado