Title: Introduccin a los Test de Hiptesis
1Introducción a los Test de Hipótesis
211.1 Introduction
- El propósito de las Pruebas de Hipótesis es
determinar si hay suficiente evidencia
estadística a favor de un cierto supuesto o
hipótesis acerca de un parámetro. - Ejemplos
- En una muestra aleatoria de clientes potenciales
hay evidencia estadística que apoye la hipótesis
de que más del 10 de los clientes potenciales
comprarán un nuevo producto? - De registros pasados se sabe que la vida útil
promedio de una pila de un reloj digital es de
305 días. Este elemento fue recientemente
modificado para que tenga mayor duración. Se
seleccionó al azar una muestra de 20 pilas
modificadas y se encontró que la vida media era
de 311 días. La duración media de la nueva pila
es mayor?
311.2 Conceptos de Test de Hipótesis
- Los conceptos básicos de los Tests de Hipótesis
- EjemploEl Jefe de Almacenes necesita determi-
nar si la demanda del producto durante el período
de reaprovisionamiento es mayor de 350. - Si es así, cambiará la política de
reaprovisionamiento. - Hay dos hipótesis acerca de una media
poblacional - H0 La hipótesis nula m 350
- H1 La hipótesis alternativa m gt 350
Esto es lo que hay que probar
411.2 Conceptos de Test de Hipótesis
- Suponga que la hipótesis nula es cierta (m 350).
m 350
- Tome una muestra de la demanda en la población y
cons- truya un estadístico relacionado con el
parámetro de la hipótesis (la media muestral). - La pregunta es Si H0 es correcta, qué probable
es obtener una media muestral al menos tan
extrema como la observada de la muestra?
511.2 Conceptos de Test de Hipótesis
- Suponga que la hipótesis nula es cierta (m 350).
m 350
- En este caso no es probable que la media m sea
mayor de 350. No rechace la hipótesis nula.
6Tipos de Errores
- Pueden ocurrir dos tipos de errores cuando se
decide si se rechaza H0 en base al valor de un
estadístico muestral. - Error de Tipo I Rechazar H0 cuando es cierta.
- Error de Tipo II No rechazar H0 cuando es
falsa. - Continuación del ejemplo
- Error de Tipo I Rechazar H0 (m 350) en favor
de H1 - (m gt 350) cuando el valor real de m es 350.
- Error de Tipo II Aceptar que H0 es correcta (m
350) cuando el valor real de m es mayor que
350.
7Control de la Probabilidad de cometer un error
de tipo I
- Tener en cuenta
- H0 m 350 y H1 m gt 350.
- H0 se rechaza si es suficientemente grande
- O sea se comete un error tipo I si
cuando m 350. - Seleccionando adecuadamente el valor crítico se
puede limitar la probabilidad de cometer un error
tipo I a un ni- vel aceptable.
811.3 Test para una Media Poblacional cuando se
conoce ?x poblacional
- Ejemplo 11.1
- Un nuevo sistema de facturación de una empresa
será eficiente solo si el promedio mensual de las
cuentas es mayor de 170. - Un muestra de 400 facturas tiene una media de
178. - Si las cuentas se distribuyen en forma
aproximadamente normal con s 65, se puede
concluir que el nuevo sistema es eficiente?
9 Test para una Media Poblacional (se conoce s )
- Ejemplo 11.1 Solución
- La población de interés son las cuentas a crédito
de una empresa. - Se quiere saber si la cuenta promedio para todos
los clientes es mayor de 170.
H1 m gt 170
- La Hipótesis Nula debe especificar un solo valor
del el parámetro m,
H0 m 170
10Enfoques para los Tests
- Hay dos enfoques para probar si la la media
muestral apoya la hipótesis alternativa (H1) - El método de la región de rechazo cuando el test
se resuelve a mano (pero se puede usar también
cuando se dispone de un software estadístico) - El método del valor-p que se usa mayormente
cuando se dispone de un software.
11El Método de la Región de Rechazo
La región de rechazo es un rango de valores tal
que, si el test estadístico cae dentro de ese
rango, se rechaza la hipótesis nula en favor de
la hipótesis alternativa.
12El Método de la Regió de Rechazo para un test
unilateral derecho
- Ejemplo 11.1 Continuación de la solución
- Tener en cuenta H0 m 170
H1 m gt 170 entonces, - Parece razonable rechazar ha hipótesis nula y
aceptar que m gt 170 si la media muestra es
suficientemente grande.
Rechazar H0aquí
Valor crítico de la media muestral
13El Método de la Región de Rechazo para un test
unilateral derecho
- Ejemplo 11.1 continuación
- Se define un valor crítico para que
sea lo - suficientemente grande para rechazar la Hipótesis
nula.
14Determinación del valor críticopara la Región de
Rechazo
- Sea ? la probabilidad de cometer un error de Tipo
I (tambien llamado el nivel de significación). - Encuentre el valor de la media muestral que sea
suficientemente grande de manera que la proba-
bilidad de cometer un error de Tipo I no exceda
de a. - Observe
15Determinación del Valor Crítico para un Test
unilateral derecho
Ejemplo 11.1 Continuación de la solución
P(cometer un error Tipo I ) P(rechazar H0 dado
que H0 es cierta)
que se llamará a.
16Determinación del Valor Crítico para un Test
unilateral derecho
Ejemplo 11.1 Continuación de la solución
a
0,05
17Determinción del Valor Críticopara un test
Unilateral derecho
Conclusión Dado que la media muestral (178) es
mayor que el valor crítico de 175,34, hay
suficiente evidencia para inferir que la media de
las cuen- tas mensuales es mayor de 170, con un
nivel de significación del 5 .
18El test estadístico estandarizado
- En vez de usar el estadístico , se puede usar
el valor estandarizado z. - Entonces, la región de rechazo pasa a ser
Test de una cola
19El test estadístico estandarizado
- Ejemplo 11.1 - continuación
- Se repetirá el ejemplo usando el test estadístico
estandarizado. - Tener en cuenta H0 m 170
- H1 m gt 170
- El Test estadístico es
- Región de rechazo z gt z0,05 1,645.
20El test estadístico estandarizado
- Ejemplo 11.1 - continuación
Conclusión Dado que Z 2,46 gt 1.645, se rechaza
la hipótesis nula en favor de la hipótesis
alternativa.
21El Método del valor-P
- El valor-p provee información acerca de la
cantidad de evidencia estadística que apoya la
hipótesis alternativa.
22El Método del valor-p
La probabilidad de observar un test estadístico
al menos tan extremo como 178, dado que m 170
es
El valor-p
23Interpretación del valor-p
- Puesto que la probabilidad de que la media
muestral tome un valor mayor que 178 cuando m
170 es tan pequeña (0,0069), hay razones para
aceptar que m gt 170.
24Interpretación del valor-p
Se puede concluir que cuando menor es el
valorp, existe mayor evidencia estadística
para apoyar la hipótesis alternativa.
25Interpretación del valor-p
- Descripción del valor-p
- Si el valor-p es menor que el 1, hay una
evidencia muy fuerte que apoya la hipótesis
alternativa.
- Si el valor-p está entre el 1 y el 5, hay una
fuerte evidencia que apoya la hipótesis
alternativa. - Si el valor-p está entre el 5 y el 10, hay una
evidencia débil que apoya la hipótesis
alternativa. - Si el valor-p supera el 10, no hay evidencia que
apoye la hipótesis alternativa.
26Los Métodos del valor-p y de la Región de
Rechazo
- Cuando se toman decisiones basadas en los métodos
de la región de rechazo, el valor-p se puede
usar de la siguiente manera - Definir la hipótesis a probar y el nivel de
significación a. - Realizar el procedimiento muestral,calcular el
test estadístico y el valor-p asociado con él. - Comparar el valor-p con a. Rechazar la hipótesis
nula sólo si el valor-p es lta en otro caso, no
rechazar la hipótesis nula.
27Conclusions de un Test de Hipótesis
- Si se rechaza la hipótesis nula, se concluye que
hay suficiente evidencia para inferir que la
hipótesis alternativa es verdadera. - Si no se rechaza la hipótesis nula,se concluye
que no hay suficiente evidencia estadística para
inferir que la hipótesis alternativa es verdadera.
La hipótesis alternativa es la más
importante. Representa qué se está investigando.
28Un Test Unilateral izquierdo
- El ejemplo del Sobre Estampillado.
- El Jefe financiero de FedEx cree que incluyendo
un sobre estampillado y auto-rotulado (SEA) en
las fac-turas mensuales que envía a sus clientes
disminuirá el tiempo que tardan los clientes en
pagarlas. - Actualmente,los clientes realizan los pagos en 24
días en promedio, con un desvío estándar de 6
días.
29Un Test Unilateral Izquierdo
- El ejemplo del sobre estampillado continuación
- Se ha calculado que una mejora de 2 días en el
promedio cubriría los costos de los sobres (los
cheques se pueden depositar antes). - Se seleccionó una muestra aleatoria de 220
clientes y a los clientes seleccionados se les
enviaron los sobres junto con sus resúmenes de
cuenta. - Se registró el tiempo de pago de los
clientes.(SSA.xls) - El Jefe de Finanzas puede concluir que el plan
será beneficioso con un nivel de significación
del 10? ?
30Un Test Unilaterial izquierdo
- El ejemplo del Sobre de SEA Solución
- El parámetro a probar es el tiempo promedio de
pago poblacional (m). - Las hipótesis sonH0 m 22H1 m lt 22 (El
Jefe quiere saber si el plan tendrá beneficios).
31Un Test Unilateral Izquierdo
- El ejemplo del sobre de SEA Continuación
- La región de rechazo Tiene sentido pensar que m
lt 22 si la media muestral es suficientemente
menor que 22. - Rechazar la hipótesis nula si
32Un Test Unilateral izquierdo
- El ejemplo del sobre de SEA continuación
- El test estandarizado de una sola cola
(izquierda)es
Definir la región de rechazo
Dado que -0,91 gt 1,28 no se rechaza la hipótesis
nula. El valor-p P(Zlt-0,91) 0,1814 Como
0,1814 gt 0,10, no se rechaza la hipótesis nula.
33Un Test Bilateral
- Ejemplo 11.2
- ENTEL fue acusada por los competidores que
afirman que sus tarifas resultan en una menor
facturación. - Un estadístico estima que la media y el desvío
estándar de las facturas de larga distancia de
ENTEL para clien- tes residenciales son 17,09 y
3,87 respectivamente.
34Un Test bilateral
- Ejemplo 11.2 - continuación
- Se selecciona una muestra aleatoria de 100
clientes y se recalculan las facturas con las
tarifas de un competidor líder.(ver fichero
Xm11-02). - Suponiendo que el desvío estándar es el mismo
(3,87), se puede inferir que existe diferecia
entre las tarifas de ENTEL y las del competidor
(en promedio)?
35Un Test bilateral
- Solución
- La media es distinta de 17,09?
H0 m 17,09
- Definir la región de rechazo
-
36Un Test bilateral
Solución - continuación
17,09
Se quiere que el rechazo erróneo de H0 sea un
evento raro, por ej. con 5 de probabilidad
37Un test bilateral
Solución - continuación
17,09
38Un Test bilateral
Hay insuficiente evidencia para inferir que hay
diferencia entre las tarifas de ENTEL y las del
competidor.
También, usando el enfoque del valor-p El
valor-p P(Zlt -1,19)P(Z gt1,19) 2(0,1173)
0,2346 gt 0,05
a/2 0,025
a/2 0,025
-1,19
1,19
3911.4 Cálculo de la Probabilidad de un Error
de Tipo II
- Para interpretar correctamente los resultados de
un test de hipótesis, se necesita - especificar un nivel de significación apropiado ó
el criterio del valor-p de un test - Entender las relaciones entre los errores de Tipo
I y de Tipo II. - Cómo se calcula un error de Tipo II?
40Tests de Hipótesis para Porcentajes
- En una muestra aleatoria de 500 adultos se
preguntó Estaría dispuesto a pagar más impuestos
para mejorar la seguridad? - 216 personas contestaron afirmativamente.
- Las hipótesis son
41Tets de Hipótesis para Porcentajes
- Se calcula el valor del test estadístico y se lo
convierte en un valor p - Valor p 2 (0.0012) 0.0024
- Decisión El valor p es pequeño y se rechaza H0
42Cálculo de la Probabilidad de un Error de Tipo
II
- Para calcular un error de Tipo II se necesita
- - expresar la región de rechazo directamente, en
términos de los parámetros (no estandarizados). - Especificar el valor alternativo bajo la H1.
- Volviendo al Ejemplo 11.1
43Cálculo de la Probabilidad de un Error de Tipo
II
Expresar la region de rechazo directamente, no
estandarizada
- Sea el valor alternativo de m 180 (en vez de
solo - m gt170)
Especificar el valor alternativo bajo H1.
No rechazar H0
44Cálculo de la Probabilidad de un Error de Tipo
II
- Un error de Tipo II ocurre cuando no se rechaza
una H0 falsa
No se rechaza... .una H0 falsa
45Cálculo de la Probabilidad de un Error de Tipo
II
m 170
46Efectos sobre b de cambios en a
- Disminuyendo el nivel de significación a, aumenta
el valor de b, y viceversa.
a1
b1
m 170
m180
47Valoración del Test
- Un test de hipótesis está efectivamente definido
por el nivel de significación a y el tamaño de
muestra n. - Si la probabilidad de un error de Tipo b se
conside- muy grande, podemos reducirla - aumentando a, y/ó
- aumentando el tamaño de la muestra.
48Evaluación del Test
- Aumentando el tamaño de muestra se reduce b
49 Evaluación del Test
- Aumentando el tamaño de muestra se reduce b
Observe qué pasa cuando n aumenta
a no cambia, pero b disminuye
50Evaluación del Test
- Aumentando el tamaño de muestra se reduce b
- En eI Ejemplo 11.1, suponga que n aumenta de 400
a 1000.
- a permanece en el 5, pero la probabilidad de un
error de Tipo II disminuye significativamente.
51Valoración del Test
- Potencia de un test
- El poder de un test se define como 1 - b.
- Representa la probabilidad de rechazar la
hipótesis nula cuando es falsa.
52Test de Diferencia de dos medias
- 1. Varianzas conocidas o tamaños de muestras
grandes. - Se dispone de muestras independientes de n1 y n2
oservacio-nes de dos variables con distribución
normal con medias ?1 y ?2 - La variable
- Luego la variable
- tiene distribución normal
53Test de Diferencia de dos medias
- Ejemplo Se desea conocer si existen diferen-
cias entre los sueldos anuales promedios de los
Técnicos de dos entes autárquicos.Se suponen
conocidas las varianzas poblacionales. - Se toman una muestra de los salarios y se tiene
la siguiente información
54Test de Diferencia de dos medias
- Las hipótesis son
- Ho ?1 ?2
- H1 ?1 ? ?2
- Se rechaza Ho si
- zHo ?z?/2 ó zHo ?(1-?/2).
- Si las variables tienen distribución normal y se
conocen las varianzas poblacionales la fórmula
anterior se puede utilizar para muestras
pequeñas. - También cuando las mues tras son grandes (n? 30 )
y se desconocen las varian- zas poblacionales.
Usando el valor pp(z?2.35) 0.0094, menor que
?/20.025, se rechaza Ho.
55Test de Diferencia de dos medias
56Test de Diferencia de dos medias