Title: Bioestadstica
1BioestadÃstica
- Inferencias con datos categóricos
2Posibles escenarios
ESTADO REAL (VERDAD) desconocido
Hay diferencia, Ha es verdadera
No hay diferencia, H0 es verdadera
Error Tipo I (a)
Diferencia (Rechazar H0 y aceptar Ha)
NO HAY ERROR
EVIDENCIA ( DATOS) observado
Error Tipo II (ß)
No diferencia (No rechazar H0)
NO HAY ERROR
3Interpretando pruebas
Prob. de error tipo Prob(Ho verdadera)
Rechazo Ho y acepto Ha Me preocupo de que Ho
pueda ser verdadera, particularmente si el
p-value es lt 0.05 pero no muy pequeño
SI
P-value de la muestra
lt 0.05
No puedo rechazar Ho y no puedo afirmar nada
sobre la validez de Ha La diferencia/asociación
observada tiene relevancia biológica? El tamaño
de muestra dió suficiente potencia (1-ß)? Si es
fácil, calcule la potencia
a o nivel de significancia
NO
4Usos de la prueba Chi2
- Para determinar si dos variables categóricas
están asociadas entre sà - Para determinar el ajuste de datos empÃricos
provenientes de una muestra a una cierta
distribución teórica - Para hacer estimación por intervalos y prueba de
hipótesis de una muestra sobre la varianza de una
población
5Principio central
- Cálculo de las diferencias (al cuadrado) entre
los valores observados y esperados de una o mas
variables - Los valores esperados se calculan de acuerdo a
una distribución planteada como hipótesis nula - Si la suma de las diferencias es grande, la
distribución propuesta para los valores esperados
(H0) no predice bien los valores que hemos
observado. Se rechaza H0.
6Ejemplo relación entre el género y el status
social
7La pregunta de interés
- El status social está relacionado con el género
en las personas encuestadas en el estudio de
DEVIDA? - La distribución por clase social es diferente
entre varones y mujeres? - La proporción de varones y mujeres difiere entre
los grupos sociales estudiados?
8Hipótesis
- Comparando la distribución por clase social
- Hipótesis nula (Ho)
- Claseshombres Clasesmujeres
- Hipótesis alternativa (Ha)
- Claseshombres ? Clasesmujeres
- Comparando la distribución por sexo
- Hipótesis nula (Ho)
- Sexoalta Sexomedia Sexobaja
- Hipótesis alternativa (Ha)
- Sexoalta , Sexomedia , Sexobajano son iguales.
Al menos una de estas proporciones difiere de las
otras
9Entendiendo el método
Un eje para calcular marginales
10Calculando valores esperados
108 0.4344 46.9 108 0.5656
61.1 1,261 0.4344 547.8 1,261
0.5656 713.2 3,481 0.4344 2,107.0
3,481 0.5656 2,473.0
11Escogiendo otro eje
Eje para calcular marginales
12Calculando valores esperados
2,107 0.0223 46.9 2,107 0.2600
547.8 2,107 0.7177 1,512.3
2,743 0.0223 61.1 2,743 0.2600
713.2 2,743 0.7177 1,968.7
13Cálculo de la Chi2
Grados de libertad (filas 1) (columnas 1)
(3-1) (2-1) 2
14En Stata
15Chi2 con 2 grados de libertad
Chi2 calculado 7.10 (p0.029)
Si Chi2gt5.99 (a0.05), rechaza H0
16Interpretación
- Según el estadÃstico Chi2 , el sexo no es
independiente del status social - La proporción de varones y mujeres difiere según
el status social - La proporción de varones es diferente
estadÃsticamente entre los tres estratos
socioeconómicos - La distribución según estrato social difiere
entre varones y mujeres
17La prueba Chi2
18Pregunta de Interés
- La distribución entre sexos difiere entre las
cuatro regiones - El sexo es independiente de la región (?)
19Hipótesis Planteadas
- Hipótesis nula (Ho)
- VaronesLima VaronesCosta VaronesSierra
VaronesSelva - Hipótesis alternativa (Ha)
- La proporción de varones difiere al menos entre
dos de las regiones
20Cálculos
- Eje a escoger
- Valores esperados
- Grados de libertad
21Interpretación
- El sexo es independiente de la región geográfica
- La proporción de varones no cambia entre las
cuatro regiones geográficas
22Ejemplo 3
- La proporción de varones y mujeres en la encuesta
es 50
23Prueba exacta de Fisher
- Válida para tablas 2x2 y para N x M
- Usa permutaciones y se basa en las probabilidades
marginales observadas - No requiere un mÃnimo valor esperado por celda
24Prueba exacta de Fisher
25Concordancia entre dos pruebas
T E S T A
Sin enfermedad (A)
Con enfermedad (A-)
TEST B
A y B a
A- y B b
Sin enfermedad (B)
A y B- c
A- y B- d
Con enfermedad (B-)
26El estadÃstico Kappa
- Concordancia Observada
Concordancia Aleatoria - Kappa ------------------------------------------
- - 1 - Concordancia
Aleatoria - Concordancia Observada (a d) / (a b c
d) - Concordancia Aleatoria a / (a b) a / (a
c) - (esperada) d / (c d) d / (b d)
27Calculando a mano
Observada 0.0509 .6765 0.7274
Aleatoria (86.3 3,120.3)/4850 0.6612
28Cálculos
- Concordancia Observada
Concordancia Aleatoria - Kappa ------------------------------------------
---- - 1 -
Concordancia Aleatoria - 0.7274 0.6612 0.0662
- Kappa ----------------- -------- 0.1954
- 1 0.6612
0.3388
29EstadÃstico Kappa
30Que debemos recordar de hoy
- El concepto y los supuestos para la aplicación de
la prueba Chi2 - Como aplicar la prueba Chi2 para determinar si
dos variables categóricas están asociadas entre
si - El uso de la prueba Chi2 para determinar la
validez de una cierta distribución teórica sobre
un conjunto de datos empÃricos - La aplicación e interpretación de la prueba Kappa
de concordancia