Title: Sesgos y confusores
1Sesgos y confusores
- Conferencia 5.1
- Nigel Paneth
2Formulación de hipótesis y errores en la
investigación
- Todos los estudios analÃticos deben iniciar con
una hipótesis claramente formulada. La hipótesis
deberá ser cuantificable y especÃfica. Deberá
predecir una relación de un especÃfico
tamaño.begin with a clearly formulated
hypothesis.
3- Por ejemplo
-  Bebés que son alimentados al seno materno
tienen menos enfermedades que los bebés
alimentados con fórmula. -  Cuáles enfermedades?Cómo es definido el tipo
de alimentación?Cuán grande es la diferencia en
riesgo? - Un mejor ejemplo
-  Bebés exclusivamente alimentados al seno
materno por 3 meses o más tendrán una reducción
en la incidencia de hospitalizaciones por
gastroenteritis de al menos del 30 durante el
primer año de vida.
4- Sólo predicción especÃfica permite extraer
legÃtimas conclusiones de un estudio que prueba
una hipótesis. Pero aún con mejores hipótesis
formuladas, dos tipos de errores pueden ocurrir. - Â
- Tipo 1 - observando una diferencia cuando no
hay ninguna. - Â
- Tipo 2 - fracasando para observar una
diferencia cuando realmente hay.
5- Esos errores son generalmente producidos por uno
o más de los siguientes - Â
- Error aleatorio
- Misclasificación al azar
- Sesgo
- Confusores
6Error aleatorio
- Desviación de resultados e inferencias de la
verdad, occurriendo como resultado del efecto del
azar. Puede producir errores tipo 1 o tipo 2.
7Misclasificación al azar (no diferencial)
- Error al azar aplicado a la medición de una
exposición o resultado. Errores en clasificación
pueden sólo producir errores de tipo 2, excepto
si aplica a un confusor o a un gradiente de
exposición.
8Sesgo
-
- Sistemática, no aleatoria desviación de
resultados e inferencias de la verdad, o procesos
que dan lugar a tal desviación. Cualquier
tendencia en la colección, análisis,
interpretación, publicación o revisión de datos
que puedan dar lugar a conclusiones que son
sistematicamente diferentes de la verdad.
(Diccionario de EpidemiologÃa, 3a ed.) - Â
-
9Más acerca de sesgo
- Note que en sesgo, el enfoque es sobre un
artefacto de alguna parte del proceso de
investigación (reunión de sujetos, colección de
datos, análisis de datos) que producen un
resultado espurio. Sesgo puede producir errores
tipo 1 o tipo 2, pero usualmente nos enfocamos en
el tipo 1 debido a sesgo.
10Mós sobre sesgo
- Sesgo puede ser conciente o inconciente. En
epidemiologÃa, la palabra sesgo no implica, como
en su uso común, perjuicio o desviación
deliberada de la verdad.
11Confusores
- Un problema resultante de que un hecho de los
sujetos en estudio no ha sido separado de un
segundo hecho, y ha sido confundido con él,
produciendo un resultado espurio. El resultado
espurio surge del efecto del primer hecho siendo
erroneamente atribuido al segundo hecho.
Confusión puede producir un error tipo 1 o tipo
2, pero usualmente se enfoca en errores tipo 1.
12La diferencia entre sesgo y confusor
- Sesgo crea una asociación que no es verdad,
pero confusores describe una asociación que es
verdad, pero potencialmente erróneo.
13Ejemplos de error aleatorio, sesgo,
misclasificación y confusor en el mismo estudio
- Estudio en un estudio cohorte, bebés de mujeres
quieneas alimentaron con fórmula y quiene
alimentaron al seno, fueron comparadas, y se
encontró que la incidencia de gastroenteritis,
registrada asà en registros médicos, es más baja
en los bebés alimentados al seno.
14Ejemplo de error aleatorio
- Por azar, hay más episodios de gastroenteritis en
el grupo alimentado con fórmula en la muestra del
estudio, produciendo un error tipo 1. (Si no se
encuentran diferencias, un error tipo 2 podrÃa
haber ocurrido si por azar habÃan sido pocos
episodios de gastroenteritis en el grupo
alimentado al seno.)
15Ejemplo de misclasificación aleatoria
- Ausencia de buena información sobre la historia
de alimentación resulta en que algunas madres que
alimentan al seno siendo aleatoriamente
clasificadas como que alimentan con fórmula, y
viceversa. Si sucede, el estudio encontrará
subestimaciones del verdadero RR, cualquier
modalidad de alimentación está asociada con alta
incidencia de enfermedad, produciendo un error
tipo 2.
16Ejemplo de sesgo
- Los registros médicos de bebés alimentados con
fórmula sólo son menos completos que aquellos de
los alimentados al seno, y asÃ, registrar sólo
pocos episodios de gastroenteritis entre ellos.
17Ejemplo de confusor
- Las madres de bebés alimentados al seno son de
clase social alta, y los bebés tienen mejor
higiene, menos hacinamiento y quizá otros
factores que protegen contra la gastroenteritis.
Hacinamiento e higiene son verdaderamente
protectores contra gastroenteritis, pero
erróneamente atribuÃmos sus efectos a la
alimentación al seno.
18Protección contra error aleatorio y
misclasificacción aleatoria
- Error aleatorio puede falsamente producir una
asociación (error tipo 1) o falsamente no
producir una asociación (error tipo 2). - Nos protegemos contra la misclasificación
aleatoria produciendo error tipo 2 eligiendo la
más precisa y segura medición de la exposición y
del resultado.
19Protección contra error tipo 1
- Protegemos nuestro estudio contra errores
aleatorio tipo 1 estableciendo que el resultado
deberá ser improbable que haya ocurrido por azar
(v.gr. Plt0.05). Valores de p son establecidas
para proteger contra errores tipo 1 debido al
azar y no se garantiza protección contra errores
tipo1 debido a sesgos o confusores. Por esto
decimos que estadÃsticos demuestran asociación
pero no causalidad.
20Protección contra error tipo 2
- Protegemos nuestro estudio contra errores tipo
2 por - proveyendo tamaño de muestra adecuado y
- haciendo hipótesis de grandes diferencias.
- Entre más grande el tamaño de muestra, más
fácil se detectará una verdadera diferencia, y
las más grandes diferencias serán más fácilmente
detectadas. (Imagine cuán difÃcil será detectar
un riesgo aumentado del 1 de gastroenteritis en
los alimentados con fórmula.)
21Dos formas de incrementar poder
- El tamaño de muestra necesario para detectar
una diferencia significativa es llamado el poder
de un estudio. - Eligiendo las mediciones más precisa y segura de
la exposición y del resultado, tienen el efecto
de incrementar el poder de nuestro estudio,
debido a que las varianzas de las mediciones del
resultado, que entran en las pruebas
estadÃsticas, están disminuÃdas. - Teniendo un tamaño de muestra adecuado de sujetos
en estudio. - Â
22Principios claves en sesgos y confusores
- El factor que crea el sesgo, o la variable
confusora, deberá estar asociada con las
variables dependiente e independiente (v.gr. Con
la exposición y con el resultado). Asociación del
sesgo o confusor sólo con una de las dos
variables no es suficiente para producir un
resultado espurio.
23Buena planeación del estudio protege contra todas
las formas de error
24- En el ejemplo dado
- Â
- El SESGO, llamado registro incompleto tiene que
estar asociado al tipo de alimentación (variable
independiente) y también con el registro de
gastroenteritis (variable dependiente) para
producir un resultado falso. - Â
- La VARIABLE CONFUSORA (o confusor) mejor
higiene, tiene que estar asociado con el tipo de
alimentación y también con gastroenteritis para
producir un resultado espurio.
25- Si el sesgo o el confusor están asociados sólo
con la variable dependiente o sólo con la
variable independiente, no producirán sesgo ni
confusión. - Esto tiene una norma útil
- Si puedes mostrar que un confusor potencial no
está asociado con una de las variables en el
estudio (exposición o resultado), confusión puede
ser excluÃdo,
26Algunos tipos de sesgo
- 1. Sesgo de selección
- Â
- Cualquier aspecto en la forma en que los sujetos
fueron reunidos en el estudio que crea una
diferencia sistemática entre las poblaciones
comparadas que no es debida a la asociación en
estudio (Sacket lo llama sesgo de muestreo) - Â Ejemplos en Sackett
- Â Sesgo de no respondentes
27- 2. Sesgos de información
- Cualquier aspecto en la forma en que la
información es reunida en el estudio que crea una
diferencia sistemática entre las poblaciones
comparadas que no se deben a la asociación en
estudio. (Sackett lo llama sesgo de medición).
El registro incompleto en el ejemplo de
alimentación infantil es una forma de sesgo de
información. - Otros ejemplos -
- Sesgo de sospecha diagnóstica
- Sesgo de recuerdo
-  Algunas veces sesgo aplican a una población de
estudios, preferentemente que a un estudio, como
en el sesgo de publicación (tendencia a publicar
artÃculos que muestran resultados positivos).
28Pensando en las formas en que las variables
pueden estar relacionadas a sesgo y confusores
- Pensar acerca de sesgo y confusores
apropiadamente, deje considerar las formas en que
exposición y enfermedad pueden estar
relacionados. Como ejemplo, un hecho
epidemiológico que ha causado controversia en
años recientes es la asociación observada entre
bajos niveles de colesterol y cáncer de colon.
29- Si encontramos que exposición A está asociada
con enfermedad B, puede ser que - Â
- 1. Exposición A causa enfermedad B
-
- Â (A B)
- v.gr. Un bajo colesterol causa cáncer de colon
30- o puede ser que
- Â
- 2. Enfermedad B cause exposición A
-
- (B A)
- Â
- v.gr. Cáncer de colon causa bajos niveles de
colesterol.
31- Identificar el camino causal correcto es
imposible sin recurrir a información adicional,
especialmente información sobre la secuencia
temporal de los dos fenómenos. Sesgo y confusor
no intervienen en este tipo particular de
confusión.
32- Pero otra forma en la cual la exposición y la
enfermedad, pueden estar relacionadas es - Â
- 3. Exposición A y enfermedad B son causados por
un por el factor X - Â
-
- X A
-
-
- B
- Â
- v.gr. Parece que diabetes e hipertensión están
asociados.
33- Diabetes causa hipertensión?
- Hipertensión causa diabetes?
- Â
- Es más probable que diabetes e hipertensión
compartan un antecedente común, por ejemplo,
obesidad. - Â
34- Si hemos concluÃdo que diabetes causó
hipertensión, si no tenÃan relación causal,
podemos decir que - Â
- La relación entre hipertensión y diabetes es
confundida por obsesidad. Obesidad deberá se
llamada variable confusora en esta relación. - Â
- Otro afirmación importante
- Confusores siempre son verdaderas causas de
enfermedad, mientras que sesgos son artefactos.
35Mediación y confusión
- No todos los factores asociados con la exposición
y con la enfermedad son una variable confusora.
PodrÃa ser una variable mediadora. - Un medidador también está asociado con las
variables independiente y dependiente, pero es
parte de la cadena causal entre las variables
independiente y dependiente.
36- Fracaso para distinguir un confusor de un
mediador, es uno de los más comúnes errores en
epidemiologÃa. - Â
- Esos dos tipos de variables no pueden ser
distinguidos con métodos estadÃsticos. Pueden ser
sólo separados basados en el entendimiento de lo
proceso total de la enfermedad. - Â
- Para hacer esta distinción clara, veamos como
controlamos para confusores en investigación
epidemiológica.
37Apropiado control para confusor
- Hipótesis Hay una asociación entre una
exposición (beber café) y una enfermedad (infarto
al miocardio).
38- Paso 1. Hay una asociación?
- Beber café eforma excesiva está estadÃsticamente
asociado con altas tasas de infarto al miocardio.
Café es luego, la causa de infarto al miocardio? - Â
- Paso 2. Identifique confusores potenciales
- Tabaquismo podrÃa ser un confusor?
- Â
- Paso 3. El confusor potencial está asociado con
la exposición? - Bebedores de café fuertes está asociado con
altas tasas de tabaquismo. Tabaquismo llena uno
de los criterios para confusores potenciales.
39- Paso 4. El confusor potencial está asociado con
la enfermedad de interés? - Smoking is associated with higher rates of
myocardial infarction. Smoking fulfills the
second criterion for potential confounding. - Â
- Paso 5. Qué sucede cuando controlamos para
tabaquismo? - El ajuste para tabaquismo elimina la asociación
de bebedores de café e infarto al miocardio. La
asociación es explicada por el hecho de que más
bebedores de café son también fumadores
40Conclusión Beber café no es una causa de infarto
al miocardio
41Control inapropiado para confusor
- Hipótesis Hay una asociación entre una
exposición (obesidad) y una enfermedad (infarto
al miocardio).
42- Paso 1. Hay una asociación? Â
- Obesidad está estadÃsticamente asociado con altas
tasas de infarto al miocardio. Es obesidad una
causa de infarto al miocardio? - Â
- Paso 2. Identifique confusores potenciales
- PodrÃa el nivel del colesterol ser un confusor?
- Â
- Paso 3. Está el potencial confusor asociado con
la exposición? - Obesidad y colesterol están asociados.
43- Paso 4. Está el potencial confusor asociado con
la enfermedad de interés? - Nivel de colesterol está asociado con tasas altas
de infarto al miocardio. - Paso 5. Qué sucede cuando controlamos para el
nivel de colesterol? - Ajuste para el colesterol elimina la asociación
de obesidad e infarto al miocardio.
44Conclusión No debemos concluir que obesidad no
es una causa de infarto al miocardio, debido a
que el nivel de colesterol puede ser parte del
camino causal de obesidad a infarto al miocardio.
Controlando por una parte de la causa, es sobre
control.
45Ejemplos numéricos para confusores (o
documentación de mediación)
- Encontramos que excesivo estudio está asociado
con migraña (RR 1.58) en un estudio cohorte de
estudiante graduados. Sin embargo, estamos
interesados en que esta exposición es confundida
con (o mediada por) teniendo sueño. Si
disminución de sueño confunde completamente la
asociación, luego, cuando estratificamos por
estatus de sueño, la odss ratio para la
asociación de estudio escesivo y migraña es
reducida a 1.o en ambos strata.
46- Estudio excesivo Correcto
- cantidad
de estudio - Migraña 22 7
- Â
- No Migraña 38 23
- Â
- TOTAL 60 30
- Â 22/60.367
- 7/30.233
- RR.367/.2331.58
47- Pero ahora estratificamos por status de sueño,
resultando dos tablas 2 x 2 - Â
- Duerme suficiente Poco sueño
- Â
- XS OK XS
OK - Â
- Migraña 20 5 2
2 -
- No Migraña 20 5 18
18 - Â
- TOTAL 40 10 20
20
48- RR es ahora 1.0 para XS estudio en cada grupo
status de sueño es un confusor o un mediador de
la asociación de estudio excesivo y migraña.
49Resúmen de cómo una tercera variable puede
relacionarse a otras dos variables(Exposición y
enfermedad)
- A. Puede ser una variable confusora
- Â
- Confusora
- Â
-
- Exposición Enfermedad
50- B. Puede ser una variable mediadora (sinónimo
variable interventora) - Â
- Â
- Exposición Mediador
Enfermedad - Â
- Â
- Una exposición que precede a un mediador en una
cadena causal es llamada una variable
antecedente.
51- Ejemplo
- Â
- Bebés Afro-Americanos son más pequeños que bebés
blancos. Bebés pequeños tienen mortalidad más
alta. Controlando por peso al nacer reduce o
elimina las diferencias entre los grupos étnicos
en mortalidad infantil. Significa que etnicidad
no es importante en mortalidad infantil?No,
debido a que peso al nacer es parte del camino
causal de etnicidad a mortalidad infantil. Es un
mediador.
52- C. Puede ser una variable moderadora (sinónimo
variable interactuante o modificadora) - Â
- Moderador
- Â
-
- Exposición Enfermedad
- Â
- Â Una variable moderadora es la que modera o
modifica el camino en el cual la exposición y la
enfermedad están relacionados. Cuando una
exposición tiene diferentes efectos sobre la
enfermedad a diferentes valores de una variable,
que es la variable llamada modificador.
53- Ejemplos
- Â
- Aspirina protege contra los ataques cardiácos,
pero sólo en hombre y no en mujeres. Decimos que
el género modera la relación entre aspirina y
ataques cardiácos, debido a que el es diferente
entre los sexos. Decimos, también, que hay
interacción entre sexo y aspirina en el efecto de
la aspirina sobre enfermedad cardiáca. - En individuos con altos niveles de colesterol,
tabaquismo produce un alto riesgo relativo de
enfermedad cardiaca que en individuos con bajos
niveles de colesterol. Tabaquismo interactúa con
colesterol en sus efectos sobre enfermedad
cardiáca.
54Un efecto de interacción o efecto modificador
- Un estudio encuentra que no hay relación, en
infantes de lt2,000 gr al nacer, entre múltiple
status del nacimiento ( siendo único o gemelo) y
el riesgo de mortalidad (Paneth et al, American J
of Epidemiology, 1982116364-375).
55- ODDS RATIO para mortalidad en únicos (comparados
con gemelos) - Â
- Sin ajustar 1.06
- Ajustado por peso al nacer 1.02
- Â
- Sin embargo, esta odds ratio, encubre interesante
información. Resulta que hay en verdad una
relación entre pluralidad y mortalidad en la
siguiente forma
56- Peso al nacer ODDS para
- mortalidad
en únicos - 501-750 gr 0.58
- 751-1000 gr 0.65
- 1001-1250 gr 0.91
- 1251-1500 gr 1.09
- 1501-1750 gr 2.45
- 1751-2000 gr 1.94
57- Claramente, bajo de 1250 gr la mortalidad es más
baja en únicos, arriba de 1250 gr es más alta en
únicos. Esos efectos en direcciones opuestas, se
cancelan uno a otro. Esta reversa de RR no es
usual - usualmente interacción acentúa un riesgo
relativo que está presente a todos los valores. - La prueba de interacción es que la ODDS RATIO (u
otras medidas de asociación) cambian
sustancialmente de acuerdo a diferentes valores
de una tercer variable.
58Como la misclasificación aleatoria puede algunas
veces producir un error tipo 1
- 1. Misclasificación aleatoria de un confusor
- Â
- Si una variable confusora es aleatoriamente
misclasificada, y luego la relación
exposición-enfermedad es estratificada (o
controlada) para este confusor, una asociación
espuria puede producirse. Esto requiere,
usualmente, que el confusor esté fuertemente
relacionado a la exposición.
59- Ejemplo Tabaquismo y beber café están asociados.
Ya que más bebedores de café son fumadores, más
bebedores de café registrados como no fumadores
son realmente fumadores que los no bebedores de
café registrados como no fumadores. Como
resultado, los bebedores de café pueden ser
encontrados en algunos estudios, por tener altas
tasas de cáncer de pulmón, aún después de
controlar por tabaquismo.
60- 2. Misclasificación al azar a lo largo de un
gradiente de exposición - Â
- Si una exposición tiene una fuerte asociación
con la enfermedad, sólo arriba de un lÃmite,
misclasificación al azar de esa exposición es
probable que produzca una relación de
dosis-respuesta. (No obstante este fenómeno
seguramente ocurre, nunca lo he visto en
epidemiologÃa.) - Si tabaquismo sólo produce cáncer de pulmón
entre los fumadores de 2 cajas al dÃa, los datos
probablemente mostrarÃan algún efecto en los
fumadores de 1 caja al dÃa, debido a que los
fumadores de más de dos cajas al dÃa sean
probablemente mal clasificados como fumadores de
una caja que los no fumadores.