Title: PRUEBAS ESTADISTICAS NO PARAMETRICAS I
1PRUEBAS ESTADISTICAS NO PARAMETRICAS I
- Mario Briones L.
- MV, MSc
- 2005
210 tareas básicas para ser más feliz
- cuidar una planta
- recordar cada día cinco cosas positivas de la
vida - salir a caminar
- hablar durante más tiempo con los seres queridos
- llamar a un amigo que no se ha visto por mucho
tiempo - reírse
- realizar ejercicios por lo menos media hora al
día tres veces por semana - sonreír a personas desconocidas
- reducir a la mitad el tiempo que se dedica a
mirar televisión - realizar tareas en beneficio de la comunidad.
3Pruebas tradicionales
- Necesitan la especificación de una distribución
- Son métodos robustos para las distribuciones
supuestas - Tienen problemas con muestras de pequeño tamaño
- Aplicación limitada a variables cuantitativas.
4Problemas de las escalas no numéricas
- No se puede definir cantidades.
- A lo más puede definirse un orden entre las
categorías - Esto significa que se establece un RANGO entre
las observaciones. - Para estos casos se han desarrollado metodos
inferenciales que no requieren definición de la
forma de la distribución.
5Comparación de pruebas paramétricas y no
paramétricas.
6Ejemplo
- Se utilizan 4 diferentes suturas en heridas
experimentales en caballos y se mide, entre otras
variables, el grado de reacción tisular en el
periodo post operatorio (en una escala de 0 a 5
puntos).
7Ejemplo grado de reacción tisular frente a
diferentes materiales de sutura.
8Análisis de rangos
- Las pruebas no paramétricas equivalentes al
análisis de varianza y prueba de t se basan en
los rangos de las observaciones en lugar de las
observaciones mismas. - Esta metodología utiliza información acerca de
los tamaños relativos de las observaciones, sin
asumir nada acerca de la naturaleza específica de
la población desde donde se obtuvieron los datos.
9Cómo elegir entre métodos paramétricos y no
paramétricos?
- El análisis de varianza es una metodología
paramétrica debido a que se basa en las
estimaciones de los parámetros de dos o más
poblaciones. - Cuando los supuestos de los métodos paramétricos
se sostienen, estas pruebas son las más poderosas.
10Cómo elegir entre métodos paramétricos y no
paramétricos?
- Cuando la población desde la cual fueron tomados
los datos no tiene distribución normal (o no es
compatible con otros supuestos como por ejemplo
la igualdad de varianza entre los grupos de
tratamiento), la media y la desviación estándar
ya no son confiables como descriptores de la
población y los métodos paramétricos dejan de ser
confiables.
11Cómo elegir entre métodos paramétricos y no
paramétricos?
- En la práctica se pueden utilizar métodos no
paramético cada vez que el tamaño de las muestras
es pequeño y por lo tanto no hay garantía de que
los estimadores tengan distribución normal.
12Pruebas no paramétricas para compararar muestras
poblaciones sobre la base de muestras
independientes
- Prueba de Mann-Whitney
- Se basa en la combinación de los conjuntos de las
n1 y n2 observaciones. - Cuando todas las observaciones están juntas se
asigna un rango a cada una de las observaciones
ordenadas, que comienza en 1 y termina en n1n2
13Procedimiento
- Se obtiene la suma de los rangos asociados con
las observaciones de una de las dos muestras.
(escogida en forma arbitraria si son del mismo
tamaño, en caso contrario se hace con la muestra
más pequeña). - Esta suma es igual a R1
- El estadístico está dado por
14Ejemplo
- Se sospecha que una empresa lleva a cabo una
política de discriminación, con respecto al sexo,
en los sueldos de sus empleados. Se seleccionaron
12 empleados masculinos y 12 femeninos de entre
los que tienen responsabilidades y experiencias
similares en el trabajo sus salarios anuales en
miles de dólares son los siguientes
15Existe alguna razón para creer que estas
muestras aleatorias provienen de poblaciones con
diferentes distribuciones? (alfa0.05).
Se combinan los salarios de las dos muestras para
formar un solo conjunto de 24 salarios anuales.
Luego se ordenan y se les asigna un rango de la
siguiente manera
16Para obtener la suma de los rangos se
seleccionará la muestra de mujeres. De esta
forma la suma de los rangos es
123567101115161824118
nstamaño de la muestra menor
17Valores críticos para la prueba de Mann Whitney
(T) - dos colas - alfa0.05 Valores menores o
iguales a los de la tabla implican rechazo de la
Hipótesis nula
18Aproximación normal
Cuando los valores de n1n2 son mayores que 30
19Resultado de la aproximación normal y conclusión
Los datos no proporcionan evidencia suficiente
para concluir que la empresa paga sueldos
diferentes a hombres y mujeres (P?0.05)
20Prueba del signo (Wilcoxon)
- Se utiliza cuando las muestras no son
independientes (equivalente a la prueba de t de
student para muestras emparejadas. - La idea básica consiste en determinar la
frecuencia con la cual el valor de un miembro del
par es superior al valor del otro miembro del par.
21Prueba del signo
- Por ejemplo, si se tienen dos grupos simbolizados
por A y B, cada vez que el valor de A es superior
al valor de B, se asigna un valor positivo y
cuando el valor de A es inferior al valor de B se
asigna un valor negativo.
22Prueba del signo
- Cuando la hipótesis nula es verdadera, deberá
haber una similar cantidad o proporción de
valores positivos y negativos. - Es decir, si la H0 es verdadera, la probabilidad
de valores positivos es 0.5
23Prueba del signo
- La estadística para la prueba del signo, denotada
por S, es el número de signos para los n pares.
- Dado que bajo H0 cada par constituye un ensayo
independiente con una probabilidad para el signo
positivo de 0.5, la estadística S tiene una
distribución binomial con p 0.5.
24Prueba del signo
- Para valores grandes de n puede utilizarse la
aproximación normal de la distribución binomial. - Cuando ocurren empates al aplicar la prueba del
signo, el procedimiento que se recomienda seguir
es el de ignorarlos y emplear la prueba sólo para
aquellos pares en los que no ocurren empates.
25Prueba del signo
- Ejemplo Se seleccionaron al azar 10 parejas de
recién casados y se les preguntó por separado,
tanto al marido como a la esposa, cuántos hijos
deseaban tener. Se obtuvieron los siguientes
datos.
26Mediante el empleo de la prueba del signo,
existe alguna razón para creer que las esposas
desean menos hijos que sus esposos? Supóngase
un tamaño máximo del error tipo I de 0.05.
27- Nótese que deberá rechazarse H0 si el número de
signos es muy pequeño. Al restar las respuestas
de cada esposo de la de su esposa, y notando que
las respuestas de cinco de las parejas son las
mismas, se obtienen el siguiente arreglo de
signos y -.
28Signos positivos 3
29Tabla de valores críticos para la prueba del
signo
La hipótesis nula se rechaza si el número de
veces que se repite el signo menos frecuente (x)
es MENOR O IGUAL que el valor de la tabla.
Cuando el tamaño de los grupos es superior a 25
se utiliza la distribución normal
30Conclusión
- Los datos proporcionan evidencia suficiente para
concluir que las esposas desean tener un mayor
número de hijos que los esposos (Plt0.05).