Title: Contrastes de Hiptesis Paramtricos
1Contrastes de Hipótesis Paramétricos
- Introducción
- Tipos de Hipótesis. Estad. del contraste
- Tipos de error
- Tipos de regiones de aceptación-rechazo
- Valor crítico o p-valor
- Etapas en la resolución de un contraste
- Relación con la estimación por intervalos
- Expresiones para los contrastes
- Ejercicios
2Introducción
El objetivo del contraste de hipótesis es
decidir si una determinada hipótesis o conjetura
sobre la distribución poblacional estudiada es
confirmada o invalidada estadísticamente a partir
de las observaciones de una muestra, es decir,
avalar o rechazar tales informaciones sobre la
característica de la población, pero no
estimarla. Ejemplos Antes de apostar cara o
cruz en el lanzamiento de una moneda, se prueba
que la moneda está equilibrada. La hipótesis de
trabajo es entonces que el parámetro p
probabilidad de sacar cara de la Bernoulli es p
0, 5 La altura media en Madrid no difiere
de la del resto de España µ 1, 68 Para
hacer la estimación puntual de la talla promedia
µ1 de los hombres chilenos, se prueba antes la
hipótesis de trabajo de que la v.a. X talla de
los hombres chilenos sigue una distribución F
Normal
3Introducción
El planteamiento general de un problema de
contraste es el siguiente Se formula una
hipótesis o conjetura acerca de la población y se
trata de ver si esa afirmación se encuentra
apoyada por la evidencia experimental que se
obtiene a través de una muestra aleatoria. Si
los valores muestrales difieren mucho de los
valores teóricos que cabría esperar bajo la
hipótesis formulada, rechazaremos la hipótesis,
caso contrario se aceptaría. Naturalmente no
se espera que, para cualquier muestra, el valor
empírico obtenido en la muestra coincida con el
valor esperado de la hipótesis el problema es
entonces decidir si la desviación encontrada
entre el valor esperado y el valor observado en
la muestra es demasiado grande para poner en duda
la hipótesis de trabajo. Ahora bien, si se
pone en duda la hipótesis original, entonces se
la rechaza en favor de una hipótesis alternativa.
4Tipos de hipótesis
Una hipótesis estadística es una afirmación que
se hace con respecto a una o más características
desconocidas de una población de interés. En
forma general, las afirmaciones no son todas del
mismo tipo, pueden involucrar ya sea el valor
numérico de algún parámetro, suponiendo la
distribución conocida (generalmente la Normal), o
la forma funcional no conocida de la distribución
de interés a partir de la cual se obtiene la
muestra . 1. H0 p 0, 5 2. H0 µ 1, 68 3.
H0 F Normal Las hipótesis del primer tipo
(1 y 2) se conocen como hipótesis paramétricas
(contrastes paramétricos) y a las del segundo
tipo (3), donde la distribución completa se pone
en tela de juicio son las llamadas hipótesis no
paramétricas (contrastes no paramétricos)
5Tipos de hipótesis
Se puede clasificar también las hipótesis
paramétricas según su grado de especifidad Hipó
tesis paramétrica simple Hipótesis que
especifica un único valor para cada parámetro
poblacional desconocido ( s 150, µX µY ,. . .
) Hipótesis paramétrica compuesta Hipótesis
que asigna un conjunto de valores posibles a
parámetros poblacionales desconocidos ( s2 gt 1, 2
lt µ lt 5,. . . ) La realización de un contraste
implica la existencia de dos hipótesis, que
denominaremos hipótesis nula (H0), e hipótesis
alternativa (H1), cada una de las cuales, en
principio, puede ser simple o compuesta. Si a
partir de la muestra se decide que la hipótesis
nula H0 es falsa, entonces se acepta como cierta
la hipótesis alternativa H1
6Tipos de hipótesis
Hipótesis nula es la hipótesis que se formula y
que se quiere contrastar es por tanto, la
hipótesis que se acepta o se rechaza como
consecuencia del contraste (generalmente, la que
intentamos rechazar). La hipótesis nula H0 es la
que el investigador asume como correcta y que no
necesita ser probada, es decir, la aceptación de
H0 no implica que ésta sea correcta o que haya
sido probada, sino que los datos no han
proporcionado evidencia suficiente como para
refutarla. El rechazo de H0 implica que la
evidencia de la muestra la refuta, o lo que es lo
mismo que, si la hipótesis es verdadera, existe
una probabilidad muy pequeña de obtener la
información muestral que de hecho se ha
observado. Se sigue la máxima de los procesos
judiciales de que el acusado es inocente hasta
que no se demuestre lo contrario Hipótesis
alternativa es cualquier otra hipótesis que
difiera de la formulada y que nos sitúe frente a
H0, de forma que si se acepta H0 se rechaza H1 y
viceversa.
7Tipos de hipótesis
Si se desea respaldar con contundencia un
determinado argumento es debido a que éste no
puede ser asumido gratuitamente y, por tanto,
sólo podrá ser defendido a través del rechazo del
argumento contrario (el establecido en H0).
Por ejemplo, si un médico desea avalar
empíricamente que una nueva vacuna es efectiva,
entonces la hipótesis nula será H0 La vacuna
no es efectiva Si un ingeniero desea mostrar
que una determinada máquina está desajustada y no
produce el promedio de piezas preespecificado
(supongamos 1.000) entonces planteará la
hipótesis H0 El promedio diario de piezas
producido por la máquina es 1.000 En ambos
casos sus argumentos se justificarán
empíricamente si los datos muestrales conducen al
rechazo de H0.
8Tipos de hipótesis
- Una hipótesis nula referente a un parámetro de
la población siempre será establecida de forma
tal que especifique un valor exacto del
parámetro, mientras que la hipótesis alternativa
admite la posibilidad de varios valores. - Para la determinación de la hipótesis
alternativa, podemos seguir, a modo de guía,
estas normas -
- Si la afirmación que deseamos probar sugiere
una dirección, como por ej más que, menos que,
superior a, inferior a, etc..., entonces H1 se
establecerá utilizando el signo de desigualdad (lt
o gt) correspondiente a la dirección sugerida. - Si la afirmación sugiere una dirección
compuesta, como por ej al menos, igual que o
mayor que, no mayor que, etc..., entonces esa
dirección (? o ?) se considerará como H0, y en H1
se representará el signo opuesto. - Si la afirmación no sugiere dirección, entonces
H1 se establece con el ?
9Tipos de hipótesis
Si H0 p 0.5, entonces H1 puede ser
cualquiera de estas H1 p gt 0.5 H1 p lt
0.5 H1 p ltgt 0.5 H1 p 0.7 Una prueba de la
forma H0 ? ?0 H1 ? ? ?0 (Contraste
bilateral) Una prueba de la forma H0 ? ?
?0 H1 ? gt ?0 (Contraste unilateral derecho)
Una prueba de la forma H0 ? ? ?0 H1 ? lt
?0 (Contraste unilateral izquierdo)
10Estadístico del contraste
Para la realización del contraste se utiliza una
estadística apropiada, cuya distribución en el
muestreo se conoce si la hipótesis que hemos
hecho es verdadera esta estadística recibe el
nombre de estadística de prueba o estadístico del
contraste. Extraída la muestra, el estadístico
tomará un cierto valor algunos valores del
estadístico puede llevarnos a sospechar que la
hipótesis no es razonable y debe ser rechazada.
Otros valores del estadístico pueden considerarse
como justificación de la hipótesis. Sin embargo,
tanto en un caso como en otro podemos estar
sujetos a equivocarnos, es decir, a rechazar una
hipótesis siendo verdadera, o bien aceptarla
siendo falsa.
11Tipos de error
Al aplicar un contraste de hipótesis
clasificamos los puntos del espacio muestral en
dos regiones excluyentes y complementarias. La
formada por los puntos tales que los valores del
estadístico de contraste nos lleva a rechazar la
hipótesis nula, se llama región crítica, y la
formada por los puntos tales que los valores del
estadístico de contraste nos lleva a aceptar la
hipótesis nula, se llama región de aceptación. El
valor del estadístico de contraste que separa una
región de otra recibe el nombre de valor
crítico. Al probar una hipótesis estadística,
nos podemos encontrar con estas
situaciones Existen dos posibilidades de
tomar una decisión equivocada con respecto al
verdadero estado de la naturaleza. Necesitamos
tener alguna cantidad que mida la posibilidad de
cometer alguno de estos errores y esta medida es
una probabilidad.
12Tipos de error
El error tipo I es el que cometemos cuando
rechazamos la hipótesis nula siendo verdadera. La
probabilidad de cometer este tipo de error,
también conocido como nivel de significación, se
denota por a, 0 ? a ? 1. Este nivel de
significación nos indica el tamaño de la región
crítica. P(rechazar H0 / H0 es cierta) a El
error tipo II es el que se comete cuando
aceptamos la hipótesis nula siendo falsa. La
probabilidad de cometer este tipo de error se
denota por ß, 0 ? ß ? 1, y es imposible
calcularla, a menos que se tenga una hipótesis
alternativa específica. P(no rechazar H0 / H0 es
falsa) ß y por tanto la probabilidad de
rechazar H0 cuando es falsa es 1-ß, es lo que se
llama función de potencia de la prueba. La
función de potencia representa la probabilidad de
rechazar la hipótesis nula, cuando esta es falsa,
y con frecuencia se utiliza para comparar
diferentes tipos de pruebas. También esta función
de potencia toma un valor diferente para cada
valor de ? de la hipótesis alternativa.
13Tipos de error
Lo ideal sería que las probabilidades de los dos
tipos de error fuesen lo más pequeñas posibles,
pero esto no es posible, pues fijado un tamaño
muestral n, si disminuimos la probabilidad de un
error entonces aumenta la probabilidad de cometer
el otro error. En la práctica se pueden seguir
los siguientes criterios de error 1.Que
únicamente se pretenda controlar el error de tipo
I, cuando sólo se rechaza H0 si la evidencia en
su contra es muy importante, y no importa cometer
el error tipo II (aceptar H0 cuando es
falsa). 2.Que la decisión garantice
probabilidades para que ambos errores queden
fijados de antemano. Fijar sólo a es inadecuado
cuando el error tipo II resulte tanto o más grave
que un error tipo I. El enfoque general es
aceptar la premisa de que el error tipo I es
mucho más serio que el error de tipo II, y
formular las hipótesis nula y alternativa de
acuerdo con lo anterior (criterio 1). Esto
también es equiparable al principio judicial
generalmente aceptado de que es peor condenar a
un inocente que dejar libre a un culpable.
14Tipos de error
Se seleccionará entonces con anticipación el
tamaño máximo del error de tipo I que puede
tolerarse y se intenta construir un procedimiento
de prueba que minimice el tamaño del error de
tipo II. Lo que se hace es seleccionar aquel
procedimiento de prueba que tenga el tamaño más
pequeño para el error de tipo II, entre todos los
procedimientos que tengan el mismo tamaño para el
error de tipo I. Es usual tomar como niveles de
significación a 0.05, a 0.01 y a 0.005, en
cuyo caso diremos que el resultado es casi
significativo, significativo y muy
significativo. Es deseable establecer tanto una
hipótesis nula como una alternativa simples, ya
que sólo de esa forma es posible determinar
valores únicos de los tamaños de los errores de
tipo I y tipo II. Si esto no es posible, siempre
se establecerá la hipótesis nula conteniendo el
signo igual, con objeto de controlar la
probabilidad de cometer el error de tipo I (más
importante), mientras que la probabilidad del
error de tipo II, quedará como una función de los
valores del parámetro ? en la hipótesis
alternativa que se plantee, obteniendo un valor
de ß diferente, para cada valor de ? de la
hipótesis alternativa.
15Tipos de error
Ejemplo Se sabe que un tipo de vacuna fría es
sólo 25 eficaz después de un período de 2 años.
Para determinar si una vacuna nueva y algo más
cara es mejor para proteger contra el mismo virus
durante un período más largo, se seleccionan 20
personas al azar y se les inyecta ésta. Sólo si
más de 8 de los que recibieron la nueva vacuna
superan los 2 años sin contraer el virus, la
nueva vacuna se considerará superior. Solución
Esto equivale a probar la hipótesis de que el
parámetro binomial para la probabilidad de éxito
en un intento dado es p 1/4 (25), contra la
alternativa p gt 1/4. H0 p 1/4 H1 p gt
1/4 Obsérvese que el signo igual está en H0, y
que se desea aceptar H1 y rechazar H0.
16Tipos de error
El estadístico de prueba sobre el que se basa la
decisión es X cantidad de individuos en el
grupo de prueba que reciben protección con la
nueva vacuna para el período de al menos 2 años.
Los posibles valores de X, de 0 a 20, se divide
en 2 grupos los menores que o iguales que 8 y
aquellos mayores que 8. Error tipo I
Rechazar H0 cuando, de hecho, es cierta La nueva
vacuna puede no ser mejor que la que actualmente
está en uso, pero para el grupo de individuos
seleccionados aleatoriamente, más de 8 sobrepasan
el período de 2 años sin contraer el virus. a
Prob. error tipo I nivel de significación P
(rechazar H0/H0 cierta) P(X gt 8 cuando p
1/4) Sb(x20,1/4) 1-Sb(x20,1/4) 1 -
0.9591 0.0409.
17Tipos de error
Es decir, la prueba, rechaza H0 equivocadamente
en el 4,09 de los casos. En otras palabras, si
el valor de p es realmente 1/4, y si se tomasen
en forma repetida muestras de tamaño 20 de la
población, cabe esperarse que en un 4,09 de las
veces, se encuentre un valor de la estadística de
prueba X mayor que 8, y de esta forma deba
rechazarse H0. Error tipo II Aceptar H0
cuando, de hecho, es falsa. Si 8 o menos
individuos del grupo seleccionado sobrepasan el
período de 2 años exitosamente y se concluye que
la nueva vacuna no es mejor, cuando en realidad
sí lo es. Para poder calcular la probabilidad de
cometer el error de tipo II, es necesario fijar
una hipótesis alternativa sencilla y concreta.
Pongamos por ejemplo p 1/2. ß Prob. error
tipo II P(aceptar H0/H0 falsa) P(X ? 8 cuando
p 1/2) Sb(x20,1/2) 0.2517. 1- ß 1-
0.2517 0.7483 ? Función de potencia. Es decir,
la prueba acepta H0 equivocadamente, en el 25,17
de los casos y rechaza H0 de forma acertada, en
el 74,83 de los casos.
18Tipos de error
Podemos modificar estos valores bien modificando
el valor crítico, o bien aumentando el tamaño de
la muestra Si cambiamos el valor crítico a 7
en el ejemplo anterior obtenemos a S b(x 20,
1/4) 1 - S b(x20,1/4) 1 - 0.8982 0.1018 ß
S b(x 20, 1/2) 0.1316 como vemos, disminuye
el valor de ß a expensas de aumentar el de a Si
aumentamos el tamaño de la muestra a 100 y el
valor crítico a 36, podremos aproximar la
binomial a la normal y obtendremos Para
determinar el error tipo I utilizaremos una
normal con µ np 1001/4 25 z (36.5 -
25)/4.33 2.66 a P(error tipo I) P(X gt
36 cuando p 1/4) ? P(Z gt 2.66) 1-P(Z lt 2.66)
1 - 0.9961 0.0039
19Tipos de error
De forma análoga, para determinar el error tipo
II utilizaremos la normal con µ np 1001/2
50 z (36.5-50)/5 -2.7 ß P(error
tipo II) P(X ? 36 cuando p1/2) ? P(Z lt -2.7)
0.0035 como vemos, en este caso disminuyen
ambos errores.
20Tipos de error
Ejemplo En cierta ciudad sólo hay dos canales
de televisión el canal 6 y el canal 10. Una
compañía se interesa en probar la afirmación de
que la proporción de televidentes para las
noticias de la tarde es igual a 0.5 para ambos
canales. la compañía encuesta a 18 residentes
seleccionados al azar y pregunta qué canal
prefieren para ver las noticias de la tarde. El
número X indica que el canal 6 es el
seleccionado. Se proponen las siguientes dos
pruebas Prueba A Rechazar H0 si X ? 4 ó X ?
14 Prueba B Rechazar H0 si X ? 5 ó X ? 13 Si
la compañía piensa tolerar un tamaño máximo de
0.1 para el error de tipo I, determinar la mejor
prueba a emplear para decidir entre H0 y
H1. Solución Las hipótesis planteadas
son H0 p 0.5 H1 p ? 0.5 La estadística de
prueba X es una variable aleatoria binomial con n
18 y, bajo la hipótesis nula, p 0.5.
21Tipos de error
Para la prueba A, la probabilidad de error de
tipo I es aA P(X ? 4 ? p 0.5) P(X ? 14 ?
p 0.5) 0.0154 0.0154 0.0308 Para la
prueba B, tenemos aB P(X ? 5 ? p 0.5)
P(X ? 13 ? p 0.5) 0.0962 Ya que ambas
pruebas tienen valores de a menores al tamaño
máximo que puede tolerarse de error de tipo I
(0.1), se compararán las funciones de potencia
para decidir cúal es la mejor de las dos. Para
p 0.4 obtenemos los siguientes datos ßA
P(4 lt X lt 14 ? p 0.4) Sb(x 18,0.4) - Sb(x
18, 0.4) 0.9987 - 0.0942 0.9045 1 - ßA 1-
0.9045 0.0955 ßB P(5 lt X lt 13 ? p 0.4)
Sb(x 18,0.4) - Sb(x 18, 0.4) 0.9942 - 0.2088
0.7854 1 - ßB 1- 0.7854 0.2146
22Tipos de error
Para p 0.6 obtenemos los siguientes datos ßA
P(4 lt X lt 14 ? p 0.6) Sb(x 18,0.6) - Sb(x
18, 0.6) 0.9058 - 0.0013 0.9045 1 - ßA 1-
0.9045 0.0955 ßB P(5 lt X lt 13 ? p 0.6)
Sb(x 18,0.6) - Sb(x 18, 0.6) 0.7912 - 0.0058
0.7854 1 - ßB 1 - 0.7854
0.2146 Observamos que para cualquiera de los
valores de p probados, la potencia de la prueba B
es mayor que la de la A, por lo que concluimos
que la prueba B es más poderosa que la A y la
mejor a utilizar para probar las hipótesis
indicadas.
23Tipos de regiones de aceptación-rechazo
Si suponemos fijado el valor de ?, el tamaño
máximo del error de tipo I que estamos
dispuestos a tolerar, podríamos establecer varias
regiones críticas posibles, todas ellas de tamaño
menor o igual que ?. Cuál elegir? Cómo
establecer en concreto el valor crítico que nos
separa las regiones de rechazo y aceptación de la
prueba de hipótesis?. La determinación de las
mejores regiones críticas para cada tipo de
contraste se hace siguiendo el Teorema de
Neymann-Pearson, que coinciden con las que se
habrían establecido de forma intuitiva. Para
una prueba de hipótesis unilateral, tal
como H0 ? ? ?0 o tal
vez H0 ? ? ?0 H1 ? gt ?0 H1 ? lt ?0
tenemos En el primer caso, la región crítica
cae totalmente en la cola derecha de la
distribución del estadístico de prueba, mientras
que en el segundo caso, la región crítica cae
totalmente en la cola izquierda de la
distribución del estadístico de prueba.
24Tipos de regiones de aceptación-rechazo
Dada una muestra aleatoria de tamaño n de la
distribución de interés, el procedimiento general
para probar H0 frente a H1 unilateral, es
escoger el mejor estimador T de ?, y rechazar H0
cuando el valor estimado t obtenido de la
muestra, es en forma "suficiente" mayor/menor que
el valor propuesto ?0. Para un tamaño a, del
error de tipo I, la región crítica se encuentra
localizada en el extremo superior/inferior de la
distribución de muestreo de T y H0 se rechaza si
el valor estimado t es mayor /menor que el valor
crítico.
25Tipos de regiones de aceptación-rechazo
Para una prueba de hipótesis bilateral, tal
como H0 ? ?0 H1 ? ? ?0 la región crítica
se divide en dos partes, generalmente simétricas,
con iguales probabilidades en cada cola de la
distribución del estadístico de
prueba. Dada una muestra aleatoria de
tamaño n de la distribución de interés, el
procedimiento general para probar H0 frente a H1
bilateral, es escoger el mejor estimador T de ?,
y rechazar H0 cuando el valor estimado t obtenido
de la muestra, se encuentre dentro de la región
crítica. Para un tamaño a, del error de tipo I,
la región crítica se encuentra localizada en los
dos extremos de la distribución de muestreo de T,
de manera que el área, en cualquier lado, más
allá del valor crítico es igual a ?/2.
26Valor crítico o p-valor
En el método clásico de contraste de hipótesis,
se acostumbraba a seleccionar un valor de a y
determinar la región crítica de acuerdo con eso.
Entonces, el rechazo o aceptación de H0
dependería de esa región crítica. Vamos a ver un
enfoque distinto. El p-valor es la
probabilidad, dado que H0 es cierta, de que la
estadística de prueba tome un valor mayor/menor o
igual que el calculado con base en la muestra
aleatoria. Sea D un estadístico de contraste y
el valor observado para una muestra determinada
(X1, . . . , Xn), es decir,
. Se denomina valor crítico o p-valor a la
probabilidad de obtener una discrepancia mayor o
igual que cuando H0 es cierta. El p-valor sólo
puede calcularse cuando la muestra está tomada, y
es distinto para cada una de ellas. Un p-valor
pequeño, sugiere que, si H0 es realmente cierta,
el valor de la estadística de prueba es poco
probable, por lo que se puede rechazar H0, ya que
esta decisión tendrá una alta probabilidad de ser
correcta.
27Valor crítico o p-valor
El cálculo del p-valor se suele usar acoplado al
enfoque clásico de escoger un tamaño del error de
tipo I antes de la determinación de la muestra
aleatoria, de la siguiente manera se elige un
nivel de significación a y si el p-valor es menor
o igual que a, se rechaza H0 de otra forma no
puede rechazarse la hipótesis nula. Para el
contraste unilateral izquierdo P Prob. (T ? t
cuando ? ?0) Para el contraste unilateral
derecho P Prob. (T ? t cuando ? ?0) Para
el contraste bilateral P 2Prob. (T ? t
cuando ? ?0) ó P 2Prob. (T ? t cuando
? ?0) En cualquier caso, si P ? a se rechaza
H0,caso contrario se acepta H0 Muchos
paquetes estadísticos para ordenador, tales como
SAS, SPSS, BMDP y otros, imprimen el p-valor para
casi todas las situaciones en las que se
involucra prueba de hipótesis.
28Etapas en la resolución de un contraste
1.- Lectura cuidadosa del enunciado y
comprobación de que lo que se necesita es un
contraste de hipótesis y de que se verifican las
condiciones necesarias para que se pueda aplicar
un contraste paramétrico. 2.- Determinación de
las hipótesis nula (H0) y alternativa (H1)
adecuadas de entre los tres tipos de contrastes
posibles (unilateral derecho e izquierdo o
bilateral). 3.- Selección del nivel de
significación a (si no viniera ya fijado). 4.-
Selección del estadístico de prueba apropiado,
cuya distribución en el muestreo se conoce si la
hipótesis nula es cierta. 5.- Determinación de
las regiones crítica y de aceptación, en función
del valor de a seleccionado. (Si la decisión se
va a basar en un p-valor, no es necesario
establecer región crítica). 6.- Calcular el
valor del estadístico de prueba para la muestra
particular. 7.- Conclusiones de tipo
estadístico rechazar H0 si el estadístico de
prueba cae en la región crítica (o el p-valor
calculado es menor o igual que el nivel de
significación deseado a) de otra forma aceptar
H0. 8.- Conclusiones de naturaleza no
estadística, como pueden ser conclusiones
biológicas, médicas, químicas, psicológicas,
económicas, etc...
29Relación con la estimación por intervalos
La estimación del intervalo de confianza implica
el cálculo de límites para los cuales es
"razonable" que el parámetro en cuestión esté
dentro de ellos, mientras que en el contraste se
decide si hay evidencias suficientes de que el
parámetro en cuestión tenga un determinado valor.
Ambos métodos basan su decisión en el mismo
estadístico, cuya distribución muestral es
conocida. La prueba de H0 ? ?0 contra H1
? ? ?0 en un nivel de significación a es
equivalente a calcular un intervalo de confianza
del 100 (1 - a) de ? y rechazar H0 si ?0 no
está dentro del intervalo de confianza y
aceptarla en caso contrario. Para el caso de
una sola media poblacional µ conociendo s2, tanto
el contraste de hipótesis como el cálculo del
intervalo, se basan en la variable aleatoria
30Relación con la estimación por intervalos
Con un valor observado , rechazar H0 en un
nivel de significación a implica que lo que
es equivalente a que es el intervalo de
confianza para la media. La equivalencia del
intervalo de confianza con las pruebas de
hipótesis se extiende a diferencias entre dos
medias, varianzas, relaciones de varianzas,
etc... En el ejemplo anterior, un intervalo de
confianza al 95 de la media µ, da los límites
9.937, 10.463. Como µ0 10 según la hipótesis
nula, y este valor se encuentra dentro del
intervalo, no se podría rechazar H0. O lo que es
lo mismo, el valor del estadístico, 1.4907
estaría entre -1.96 y 1.96 que son los valores
de -za/2 y za/2 para a 0.05 y considerando la
hipótesis alternativa bilateral, con lo cual
tampoco se rechazaría H0.
31Expresiones para los contrastes
Contraste para la Media de una población normal,
conocida la Varianza Sea X1, X2, ... Xn una
muestra aleatoria de una distribución normal con
media µ desconocida, suponiendo conocido el valor
de la varianza poblacional s2. Nos interesa
probar uno de los siguientes conjuntos de
hipótesis respecto a µ Contraste
Bilateral H0 µ µ0 H1
µ ? µ0 Contraste Unilateral
Derecho H0 µ µ0 ( µ ? µ0) H1 µ gt
µ0 Contraste Unilateral
Izquierdo H0 µ µ0 ( µ ? µ0) H1 µ
lt µ0 Tomamos como estadístico
de prueba la media muestral
32Expresiones para los contrastes
Bajo la hipótesis nula (µ µ0) este estadístico
sigue una distribución normal N(µ0, )
donde n es el tamaño de la muestra. La
distribución de la variable tipificada sigue
una N(0,1). Si fijamos un nivel de significación
a y la hipótesis nula es cierta, el valor de z,
obtenido de una muestra real para el estadístico
, se encontrará entre - za/2 y za/2, con
una probabilidad de 1- a. Las regiones críticas
y de aceptación serán entonces Contraste
Bilateral R.C z z gt za/2 R.A z z
? za/2 Se acepta H0 si Se rechaza H0 si
33Expresiones para los contrastes
Contraste Unilateral Derecho R.C z z gt
za R.A z z ? za Contraste Unilateral
Izquierdo R.C z z lt za R.A z z ? za
Ejemplo Los siguientes datos representan
los tiempos de armado para 20 unidades
seleccionadas aleatoriamente 9.8, 10.4, 10.6,
9.6, 9.7, 9.9, 10.9, 11.1, 9.6, 10.2, 10.3, 9.6,
9.9, 11.2, 10.6, 9.8, 10.5, 10.1, 10.5, 9.7.
Supóngase que el tiempo necesario para armar una
unidad es una variable aleatoria normal con media
µ y desviación típica s 0.6 minutos. Con base
en esta muestra, existe alguna razón para creer,
a un nivel de 0.05, que el tiempo de armado
promedio es mayor de 10 minutos? Solución Hipót
esis H0 µ 10 H1 µ gt 10 De los datos de la
muestra obtenemos que el valor de es igual a
10.2 minutos.
34Expresiones para los contrastes
Entonces Dado que P(Z ? 1.645) 0.05, el
valor crítico en términos de la variable
aleatoria normal estándar es z0.95 1.645, y
puesto que z 1.4907 lt z0.95 1.645, no puede
rechazarse la hipótesis nula. Esto nos indica
que, con base a esta muestra, no existe
suficiente evidencia como para rechazar la
hipótesis de que el tiempo promedio necesario
para armar una unidad es de 10 minutos, por lo
que debemos seguir considerándolo cierto. El
p-valor en este caso vendría dado por P(Z ?
1.4907 / µ 10) 0.0681, que al ser mayor que
el nivel de significación fijado a 0.05, nos
indica que, con base a la muestra, no existe
suficiente evidencia como para rechazar la
hipótesis de que el tiempo promedio necesario
para armar una unidad es de 10 minutos.
35Expresiones para los contrastes
Contraste para la Media de una población normal,
desconocida la Varianza En este caso cabría
distinguir dos situaciones, según que la muestra
que tomemos sea grande ( gt 30) o pequeña ( ? 30).
Sea X1, X2, ... Xn una muestra aleatoria de
una distribución normal con media µ desconocida,
suponiendo también desconocido el valor de la
varianza poblacional s2, por lo que se aproxima
por su estimación, la cuasivarianza muestral. Nos
interesa probar uno de los siguientes conjuntos
de hipótesis respecto a µ Contraste
Bilateral H0 µ µ0 H1
µ ? µ0 Contraste Unilateral
Derecho H0 µ µ0 ( µ ? µ0) H1 µ gt
µ0 Contraste Unilateral
Izquierdo H0 µ µ0 ( µ ? µ0) H1 µ
lt µ0
36Expresiones para los contrastes
Tomamos como estadístico de prueba la media
muestral
Muestras grandes Bajo la hipótesis nula (µ
µ0) y para muestras grandes, este estadístico
sigue una distribución aproximadamente normal
N(µ0, ) donde n es el tamaño de la muestra.
La variable tipificada Las regiones críticas
y de aceptación serán entonces Contraste
Bilateral R.C z z gt za/2 R.A z
z ? za/2 Contraste Unilateral Derecho R.C
z z gt za R.A z z ? za Contraste
Unilateral Izquierdo R.C z z lt -za R.A
z z ? - za
37Expresiones para los contrastes
Muestras pequeñas En este caso todo es igual
que en el caso anterior exceptuando que ahora el
estadístico elegido, sigue una distribución t de
Student con n-1 grados de libertad, en lugar de
una distribución normal, y por tanto cambian
también las regiones críticas Las regiones
críticas y de aceptación serán entonces Contrast
e Bilateral R.C t t gt ta/2, n-1 R.A
t t ? ta/2, n-1 Contraste Unilateral
Derecho R.C t t gt ta, n-1 R.A
t t ? ta, n-1 Contraste Unilateral
Izquierdo R.C t t lt-ta, n-1 R.A
t t ? - ta, n-1
38Expresiones para los contrastes
Contrastes de la Diferencia de Medias Selecciona
mos dos muestras aleatorias independientes de
tamaños n1 y n2 de dos poblaciones normales con
medias ?1 y ?2 y varianzas ?21 y ?22
respectivamente. La estadística a utilizar en
este caso es . Se puede esperar que la
distribución muestral de sea
aproximadamente normal, con media
y desviación típica
39Expresiones para los contrastes
Contrastes de diferencia de medias con varianzas
conocidas Supóngase que se desea probar la
hipótesis nula H0 µ1 µ2 contra una de las
siguientes alternativas H1 µ1 gt µ2 H1 µ1 lt
µ2 H1 µ1 ? µ2 La estadística a utilizar en este
caso es la diferencia muestral de las medias,
que es una variable aleatoria, ya que y
son variables aleatorias independientes, y además
se distribuye según una N(µ1-µ2,
Por tanto la estadística sigue una
N(0,1) si la hipótesis nula es cierta (µ1 µ2).
Las regiones críticas y de aceptación serán
entonces Contraste Bilateral R.C z z gt
za/2 R.A z z ? za/2 Contraste
Unilateral Derecho R.C z z gt za R.A
z z ? za Contraste Unilateral Izquierdo R.C
z z lt - za R.A z z ? - za
40Expresiones para los contrastes
Contrastes de diferencia de medias con varianzas
desconocidas Supóngase que se desea probar la
hipótesis nula H0 µ1 µ2 contra una de las
siguientes alternativas H1 µ1 gt µ2 H1 µ1 lt
µ2 H1 µ1 ? µ2 La estadística a utilizar en este
caso también es la diferencia muestral de las
medias, que es una variable aleatoria, ya
que y son variables aleatorias
independientes, La distribución que sigue esta
estadística así como las regiones críticas a que
da lugar, las podemos dividir en tres casos
diferentes Muestras grandes n1n2 gt 30 n1 ?
n2 El estadístico del contraste viene dado por
que, en este caso, bajo la hipótesis nula,
sigue una distribución aproximadamente N(0,1)
41Expresiones para los contrastes
Las regiones críticas y de aceptación serán
entonces Contraste Bilateral R.C z
z gt za/2 R.A z z ? za/2 Contraste
Unilateral Derecho R.C z z gt za R.A
z z ? za Contraste Unilateral Izquierdo R.C
z z lt - za R.A z z ? - za Muestras
pequeñas n1 n2 ? 30 Varianzas desconocidas
pero iguales s12 s22 El estadístico del
contraste viene dado por que, en este caso,
bajo la hipótesis nula, sigue una distribución t
de Student con (n1 n2 - 2) grados de libertad.
Las regiones críticas y de aceptación serán
entonces Contraste Bilateral R.C t t gt
ta/2, n1 n2- 2 R.A t t ? ta/2, n1 n2
- 2 Contraste Unil. Derecho R.C t t gt ta,
n1 n2- 2 R.A t t ? ta, n1 n2-
2 Contraste Unil. Izquierdo R.C t t lt-ta,
n1 n2- 2 R.A t t ? -ta, n1 n2- 2
42Expresiones para los contrastes
Muestras pequeñas n1 n2 ? 30 Varianzas
desconocidas y distintas sx2 ? sy2 El
estadístico del contraste viene dado por
que, en este caso, bajo la hipótesis nula,
sigue una distribución t de Student con f grados
de libertad, siendo f la aproximación de Welch
dada por redondeado al entero más
cercano. Las regiones críticas y de aceptación
serán entonces Contraste Bilateral R.C
t t gt ta/2, f R.A t t ? ta/2, f
Contraste Unilateral Derecho R.C t t gt
ta, f R.A t t ? ta, f Contraste Unilateral
Izquierdo R.C t t lt-ta, f R.A t t ?
- ta, f
43Expresiones para los contrastes
Datos emparejados En este caso tenemos las
observaciones en pares, de manera que existe una
relación natural entre las observaciones de un
par, y donde se supone que las condiciones
externas son las mismas para cada par pero pueden
variar de par en par. Sean (X1, Y1), (X2, Y2),
..., (Xn, Yn) los n pares a partir de los cuales
calculamos las diferencias Di Yi - Xi, que
constituyen variables aleatorias independientes
distribuidas normales, tales que EDi µd µy
- µx y VDi sd2 para toda i1,2, ..., n.
Como no conocemos µd ni sd2, se estimarán por
y . De esta manera se pueden formular
inferencias sobre las medias de dos niveles
cuando las observaciones están pareadas
considerando la columna de diferencias como una
sóla variable aleatoria y aplicar los métodos que
ya hemos visto. Como en ese caso, estamos
interesados en contrastar la hipótesis nula H0
µx µy que equivale a µd 0
44Expresiones para los contrastes
contra una de las siguientes alternativas H1 µy
gt µx (µd gt 0) H1 µy lt µx (µd lt 0) H1 µx
? µy (µd ? 0) El estadístico de
contraste es que, bajo la hipótesis nula,
sigue una distribución t de Student con n-1
grados de libertad. Las regiones críticas y de
aceptación serán entonces Contraste
Bilateral R.C t t gt ta/2, n-1 R.A t
t ? ta/2, n-1 Contraste Unilateral
DerechoR.C t t gt ta, n-1 R.A t t ?
ta, n-1 Contraste Unilateral IzquierdoR.C
t t lt - ta, n-1 R.A t t ? - ta, n-1
45Expresiones para los contrastes
Contrastes sobre la varianza de una población
normal En esta ocasión deseamos probar la
hipótesis que considera la uniformidad de una
población. Consideraremos la hipótesis nula H0
s2 s02 contra una de las siguientes
alternativas H1 s2 gt s02 H1 s2 lt s02 H1 s2
? s02 El estadístico apropiado sobre el cual
se basa la decisión es el mismo que se utilizó
para determinar el intervalo de confianza para la
varianza, que si la hipótesis nula es cierta,
viene dado por donde n es el tamaño de la
muestra y sigue una distribución ?2con n-1 grados
de libertad. Las regiones críticas y de
aceptación serán entonces Contraste
BilateralR.C ?2 ?2 ? ?21 - a/2, n-1 ?2 ?
?2a/2, n - 1 Contraste Unil. Derecho R.C
?2 ?2 ? ?21 - a, n-1 R.A ?2 ?2 lt ?21 - a,
n-1 Contraste Unil. Izquierdo R.C ?2 ?2 ?
?2a, n-1 R.A ?2 ?2 gt ?2 a, n-1
46Expresiones para los contrastes
Contraste de igualdad de varianzas de dos
poblaciones normales Consideramos ahora el
problema de contrastar dos varianzas
poblacionales, que en general se aplica antes de
una prueba t combinada para comprobar la
suposición de igualdad de varianzas. Sean X1, X2,
... Xn1 y Y1, Y2, ... Yn2 muestras aleatorias
provenientes de dos distribuciones normales
independientes con medias desconocidas µx y µy y
varianzas desconocidas, por lo que se aproximan
por las cuasivarianzas muestrales. Contrastaremos
la hipótesis nula H0 sx2 sy2 contra una de
las siguientes alternativas H1 sx2 gt sy2 H1
sx2 lt sy2 H1 sx2 ? sy2 La estadística a
utilizar en este caso, al igual que para el
intervalo de confianza, vendrá dado por que,
si la hipótesis nula es cierta, sigue una
distribución F de Snedecor con n1-1, n2-1 grados
de libertad.
47Expresiones para los contrastes
Las regiones críticas serán entonces Contraste
Bilateral R.C ff ? F1 - a/2, (n1-1),(n2 -1)
f ? 1/ F1 - a/2, (n2 - 1), (n1 - 1) Contraste
Unilateral Derecho R.C f f ? F 1 - a,
(n1-1), (n2 - 1) Contraste Unilateral
Izquierdo R.C f f ? 1/F1 - a, (n2-1),(n1 -
1)
48Expresiones para los contrastes
Contraste para el parámetro p de una distribución
binomial Se considerará el problema de probar
la hipótesis de que la proporción de éxitos en un
experimento binomial es igual a un valor
especificado. Es decir, se está probando la
hipótesis nula H0 p p0 frente a cualquiera
de las alternativas H1 p gt p0 H1 p lt p0
H1 p ? p0 La variable aleatoria apropiada
sobre la cual se fundamenta el criterio de
decisión es la variable aleatoria binomial de
parámetros n (nº de experimentos) y p (proporción
poblacional de éxitos, es decir, el parámetro
cuyo valor queremos contrastar). Si H0 es
cierta, entonces X se distribuye como una
B(n,p0).
49Expresiones para los contrastes
Para valores pequeños de n, se deben obtener las
probabilidades binomiales, a partir de la fórmula
binomial real o de su tabla correspondiente.
Pero, puesto que X es una variable aleatoria
discreta, es poco probable que pueda determinarse
una región crítica cuyo tamaño sea exactamente
igual al valor predeterminado de a, por ello es
preferible, cuando n es pequeña, basar las
decisiones en el p-valor. Siendo x el número
de éxitos en la muestra, tendríamos
entonces Para el contraste unilateral
izquierdo P Prob. (X ? x cuando p p0)
Para el contraste unilateral derecho P
Prob. (X ? x cuando p p0) Para el
contraste bilateral si x lt n p0 P 2Prob.
(X ? x cuando p p0) si x gt n p0 P 2Prob.
(X ? x cuando p p0) En cualquier caso, Si P ?
a se rechaza H0
50Expresiones para los contrastes
Sin embargo, si n es grande, y utilizamos la
variable binomial X, generalmente se prefiere
utilizar su aproximación a la curva normal con
parámetros µ np y s2 npq. También es posible
utilizar el estadístico que, para n grande, se
puede aproximar, a una normal de parámetros µ
p y s2 pq/n. Por tanto tendremos que,
como vemos, sigue dependiendo del parámetro p que
queremos contrastar.
51Expresiones para los contrastes
Igual que se hizo en la estimación por
intervalos, para valores de n grandes y si p0 no
está cerca de 0 ni de 1, se suele sustituir la p
del denominador, por su aproximación muestral, y
obtendríamos entonces que, si la H0 es
cierta, sigue una distribución
aproximadamente N(0,1). Si se verifican las
condiciones anteriores, y si H0 es cierta,
también se puede sustituir p por p0 tanto en el
numerador como en el denominador, y se obtiene
una aproximación bastante precisa en muchos
casos, y entonces las regiones críticas y de
aceptación para este contraste vendrían dadas
por Contraste Bilateral R.C z z gt
za/2 R.A z z ? za/2 Contraste
Unilateral Derecho R.C z z gt za R.A z
z ? za Contraste Unilateral Izquierdo R.C
z z lt -za R.A z z ? -za
52Expresiones para los contrastes
Contraste para la diferencia de dos
proporciones Se seleccionan al azar dos
muestras independientes grandes, de tamaño n1 y
n2, de dos poblaciones binomiales, de parámetros
p1 y p2 respectivamente. Se desea contrastar la
hipótesis de que las proporciones (parámetro p)
de ambas poblaciones son iguales. Es decir, se
está probando la hipótesis nula H0 p1
p2 frente a cualquiera de las alternativas H1
p1 gt p2 H1 p1 lt p2 H1 p1 ? p2 El
estadístico sobre el que se basaría la decisión
es En la estimación por intervalos, habíamos
visto que la diferencia de proporciones
muestrales de éxito, para una n lo bastante
grande, tenía una distribución aproximadamente
normal con media y varianza
53Expresiones para los contrastes
Y por tanto, el estadístico de contraste
quedaría Cuando H0 es cierta, se puede
sustituir p1 p2 p y q1 q2 q, donde p y
q seguirían siendo los valores que queremos
contrastar. Una estimación muestral de estos
parámetros, la podemos obtener combinando los
datos de ambas muestras, de la siguiente
forma siendo x1 y x2 el número de éxitos en
ambas muestras. Por tanto quedaría Siendo
las regiones críticas y de aceptación, para un
nivel de significación a Contraste Bilateral
R.C z z gt za/2 R.A z
z ? za/2 Contraste Unilateral Derecho
R.C z z gt za R.A z z ?
za Contraste Unilateral Izquierdo R.C
z z lt - za R.A z z ? - za
54Ejercicios
Ejercicio 7.1 Dada la proposición de un
problema, escriba las hipótesis nula y
alternativas correctas. (Suponiendo siempre que
ya se ha decidido que el método a usar es un
contraste paramétrico) a) El Señor y la Señora
Martínez suponen que el peso medio de una
berenjena que crece en su jardín excede el
promedio de 953 gramos que aparecen en el paquete
de las semillas. b) En una presentación a
posibles anunciadores, el canal de televisión
dice que, de la audiencia total de un sábado por
la noche, más del 75 estará viendo el programa
de dicho canal. c) Una compañía que produce
tubos de hierro colado debe verificar el
porcentaje de silicona en el hierro. La cantidad
óptima es 0.75 gramos de silicona por 100 gramos
de hierro. El analista de control de calidad
desea probar la hipótesis de que hay 0.75 gramos
de silicona en cada 100 gramos de hierro. d) Se
estima que la cantidad promedio de hemoglobina en
la sangre de la trucha café, por cada 100 ml es
de por lo menos 5.5 gramos. Establezca esta
hipótesis para ser probada.
55Ejercicios
Ejercicio 7.2 A una muestra aleatoria de 400
votantes de una cierta ciudad se le pregunta si
está a favor de un impuesto adicional a la venta
de gasolina para proporcionar ingresos necesarios
para efectuar trabajos de reparación de calles.
Si más de 220 pero menos de 260 están a favor del
impuesto, se concluirá que el 60 de los votantes
está a favor. a) Encuentre la probabilidad de
cometer un error tipo I si 60 de los votantes
está a favor del nuevo impuesto. b) Cuál es la
probabilidad de cometer un error tipo II al
utilizar este procedimiento de prueba, si sólo
48 de los votantes está a favor del nuevo
impuesto?
56Ejercicios
Ejercicio 7.3 Una muestra aleatoria de 8
cigarros de una marca determinada tiene un
contenido promedio de nicotina de 4.2 miligramos
y una desviación estándar de 1.4 miligramos.
Está esto de acuerdo con la afirmación del
fabricante de que el contenido promedio de
nicotina no excede de 3.5 miligramos? Utilice un
nivel de significación de 0.05 en su conclusión y
suponga que la distribución de los contenidos de
nicotina es normal. Ejercicio 7.4 Una muestra
aleatoria de tamaño n1 25, tomada de una
población normal con una desviación estándar de
?1 5.2, tiene una media x1 81. Una segunda
muestra aleatoria de tamaño n2 36, tomada de
una población normal diferente con una desviación
estándar de ?23.4, tiene una media x2 76.
Pruebe la hipótesis de que ?1 ?2 con un nivel de
significación de 0.05.
57Ejercicios
Ejercicio 7.5 Un investigador asegura que la
vida promedio de ratones se incrementa al menos
en 8 meses cuando las calorías en sus alimentos
se reducen aproximadamente 40 desde el momento
en que son destetados. Suponga que una muestra
aleatoria de 10 ratones se alimenta con una dieta
normal y vive un promedio de 32.1 meses con una
desviación estándar de 3.2 meses, mientras que
una muestra aleatoria de 15 ratones come la dieta
restringida y vive un promedio de 37.6 meses con
una desviación estándar de 2.8. Pruebe la
hipótesis a un nivel de significación de 0.05.
Suponga que las distribuciones de las vidas para
las dietas regular y restringida son
aproximadamente normales con varianzas iguales.
58Ejercicios
Ejercicio 7.6 En un estudio se compararon los
niveles de ácido ascórbico en plasma de mujeres
embarazadas entre fumadoras y no fumadoras. Para
el estudio se seleccionaron 32 mujeres en los
últimos 3 meses de embarazo, libres de cualquier
padecimiento importante y con edades entre 15 y
32 años. De las muestras de sangre, se
determinaron los siguientes valores de ácido
ascórbico, en gramos por mililitro, en el plasma
de cada sujeto
Existen suficientes evidencias, a un nivel de
significación de 0.05, para concluir que hay una
diferencia entre los niveles de ácido ascórbico
en la sangre de las mujeres fumadoras y no
fumadoras?. Suponga que los dos conjuntos de
datos se toman de poblaciones normales con
varianzas diferentes.
59Ejercicios
Ejercicio 7.7 Se llevó a cabo un estudio para
determinar si la resistencia de una herida por
incisión quirúrgica era afectada por la
temperatura del cuchillo. Se utilizaron 8 perros
en el experimento. Se realizó una incisión
caliente y una fría en cada perro y enseguida se
midió la resistencia. Los datos resultantes
son Escriba una hipótesis apropiada
para determinar si hay una diferencia
significativa entre las incisiones calientes y
frías y pruébela con un nivel de significación de
0.05.
60Ejercicios
Ejercicio 7.8 Una compañía productora de
combustible asegura que una quinta parte de los
hogares de cierta ciudad se calientan con
petróleo. Se tiene alguna razón para dudar de
esta afirmación, a un nivel de significación de
0.01 si, en una muestra aleatoria de 1000 hogares
en esta ciudad, se encuentra que 236 se calientan
con petróleo?. Suponer distribución
normal. Ejercicio 7.9 En un estudio para
estimar la proporción de residentes de una ciudad
y sus suburbios que está de acuerdo con la
construcción de una planta de energía nuclear, se
encontró que 63 de 100 residentes urbanos
favorecen la construcción mientras que 59 de 125
residentes suburbanos se oponen. Existe alguna
diferencia significativa entre las proporciones
de residentes urbanos y suburbanos que favorecen
la construcción de la planta nuclear? Ejercicio
7.10 Se sabe que el contenido en nicotina de una
marca de cigarros tiene distribución
aproximadamente normal y se supone que su
varianza es de 1.3 miligramos. Pruebe esta
hipótesis, a un nivel de significación de 0.05,
si una muestra aleatoria de 8 de estos cigarros
tiene una desviación estándar de s 1.8.