Title: Bioestadistica
1Bioestadistica
- Ana Lorena Solis G., Bioestadistica
2Objetivo general de este curso
- Adquirir dominio de los conceptos y ténicas
básicas de la Estadística aplicada al estudio de
la salud y de la población
3Objetivos de este curso
- Reconocer las situaciones donde se pueden aplicar
los diferentes métodos estadísticos. - Ser capaz de llevar a cabo un análisis básico de
datos y hacer una presentación adecuada de los
mismos. - Entender los conceptos de la Inferencia
Estadística. - Reconocer los elementos básicos del diseño de un
estudio en salud y población y su relación con el
análisis e interpretación de los datos. - Saber identificar e interpretar la relación entre
variables. - Desarrollar la habilidad de aplicar estas
técnicas mediante la preparación de un trabajo
usando datos reales.
4Programa de este curso
- I. Introducción
- Definición de conceptos Biosestadística,
Estadística Descriptiva e Inferencial, Unidad de
Estudio, Población, Muestra, etc. Classificación
de variables. Tipos de análisis. 1 semana. - II. Diseño de Estudios en Salud y Población
- Tipos de Estudios (experimentales y no
experimentales). Tipos de sesgos (selección,
información, confusión). Error aleatorio. Efecto
de Modificación o Interacción. Validez y
Confiabilidad. Causalidad. 3 semanas. - III. Estadística Descriptiva
- Medidas de Tendencia Central. Medidas de
Variabilidad. Datos Agrupados. Percentiles.
Medidas de frecuencia de Enfermedad (tasas y
razones, prevalencia e incidencia, tasas crudas y
ajustadas). Presentación de la Información
(cuadros y gráficos). 4 semanas. - IV. Inferencia Estadística
- Definiciones. Variables Aleatorias,
Distribuciones y Distribuciones Muestrales. La
Distribución Normal. Estimación y Prueba de
Hipótesis. Tamaño de Muestra. Inferencia para
Medias y Proporciones (una y dos poblaciones).
Análisis de Variancia. 4 semanas. - V. Métodos Estadísticos
- Análisis de Datos Categóricos (Chi-cuadrado,
Mantel-Haenszel, Métodos No-Paramétricos).
Introducción a los Modelos de Regresión (Simple,
Múltiple, Modelo Logistico). 3 semanas.
5Preguntas estadísticas al inicio de una
investigación
?
- Que tipo de investigación es?
- Cuáles datos se necesitan? Existen los datos y
están disponibles? Cuál es la calidad de los
datos existentes?
- Es un análisis univariado, bivariado o
multivariado?Qué técnicas se requieren?
6Qué tipo de investigación es?
Interesa generalizar los resultados?
- Alcance transversal
- Alcance longitudinal
7Existen los datos y están disponibles?
- Validez y confiabilidad
- Periodicidad
Existentes
- Técnicas de recolección de datos
- Entrevistas personales, telefónicas, por correo,
entre otras - Observación
- Cuestionarios y formularios estructurados y
precodificados
Inexistentes
8Es un análisis univariado, bivariado o
multivariado?
1
- Distribuciones de frecuencias simples o
acumuladas (Forma vertical y horizontal) - Medidas de posición (moda, promedio, cuantilos,
simetría) - Medidas de dispersión (variancia, coeficiente de
variación, achatamiento, recorrido intercuartil)
Univariado
9Es un análisis univariado, bivariado o
multivariado?
- Distribuciones de frecuencias cruzadas (Forma,
asociación, correlación) - Medidas de posición y de dispersión
- Regresión simple y correlación
- Pruebas de hipótesis
2
Bivariado
10Es un análisis univariado, bivariado o
multivariado?
3
- Análisis de variancia múltiple
- Análisis de factores
- Análisis de componentes principales
- Análisis discriminante
- Regresión múltiple y series temporales
Multivariado
- Análisis de conglomerados
- Análisis de correspondencia
- Escalas multidimensionales
11De acuerdo a los objetivos de investigación...
Análisis descriptivo
Análisis predictivo
Análisis de causalidad
12Análisis Predictivo
- Tasas (geométrica, exponencial, simple)
Modelos de crecimiento
- Simples
- Múltiples
- Lineales
- No lineales
Modelos de regresión
13Análisis de causalidad
- Modelos de asociación parcial y múltiple
- Diseños experimentales controlados
14Definición de Estadística
Popular
Sinónimo de dato
Rama del saber que se ocupa del desarrollo y
aplicación de métodos eficientes de recolección,
elaboración, presentación, análisis e
interpretación de datos numéricos (Moya, 1997)
Ciencia
15Tipos de Investigación Científica
Tiempo
Transversal Longitudinal Retrospectivo Prospectivo
Forma
Descriptiva Explicativa Experimental No
experimental
16Conceptos Básicos
- Unidad estadística
- Tipo de Características
- Escalas de medición
- Instrumentos de Medición
- Confiabilidad y validez
- Factores que afectan
- Variables aleatorias
17Definición de la población
- Unidad estadística
- Aquella persona, elemento u objeto sobre el cual
recae la observación. Definida en tiempo y
espacio. - Población
- Conjunto de unidades estadísticas
- Muestra
- Subconjunto de unidades estadísticas
18Características y observaciones
19Medición...
- Según Hernández Sampieri
- ...el proceso de medición es vincular conceptos
abstractos con indicadores empíricos - ...Un instrumento de medición adecuado es aquel
que registra datos observables que representan
verdaderamente los conceptos que el investigador
tiene en mente - Hernández Sampieri, pág 242
20Escalas de Medición
- Nominal
- Ordinal
- Intervalo
- Razón
21Características de un Instrumento de Medición
- Validez Se refiere al grado en que un
instrumento mide lo que se desea medir. - Cómo medir la validez ?
- Contenido
- Criterio
- Constructo
22Características de un Instrumentode Medición
- Confiabilidad Se refiere al grado en que su
aplicación repetida al mismo sujeto u objeto,
produce el mismo resultado. - Cómo medir la confiabilidad ?
- Medida de estabilidad
- Test/Retest
- Método de mitades partidas
- Coeficiente alfa
23Factores que afectan la Confiabilidad y la Validez
- Improvisación
- Instrumentos no validados
- Lenguaje del instrumento
- Condiciones de ambiente
24Formas de recolección de datos
- Datos existentes
- Fuentes primarias
- Fuentes secundarias
- Datos no existentes
- Entrevista (personal, telefónica, por correo)
- Observación (directa, participantes)
- Observación cualitativa
25Características y observaciones
Variables aleatorias
Una función cuyo resultado es conocido pero
dependen del azar
26Esquema General de la Investigación Científica
- Selección del tema de investigación
- Planteamiento formal del problema
- Definición de hipótesis y objetivos
- Elaboración de un marco teórico
- Elaboración de un marco metodológico
- Recolección y procesamiento de datos
- Presentación y análisis de datos
- Conclusiones
27Esquema General de la Investigación Científica
- Selección del tema de investigación
- Conveniencia
- Relevancia social
- Implicaciones prácticas
- Valor teórico
- Utilidad metodológica
28Esquema General de la Investigación Científica
- Planteamiento formal del problema
- Definición en tiempo y espacio
- Implica posibilidad de prueba empírica
- Relación entre variables (si es posible)
29Esquema General de la Investigación Científica
- Definición de hipótesis y objetivos
- Guías del proceso de investigación
- Posibles de ser alcanzados
- Congruentes entre sí
30Esquema General de la Investigación Científica
- Elaboración del marco teórico
- Revisión de literatura
- Adopción de una o varias teorías que describan,
expliquen y ayuden a predecir un fenómeno de
manera sencilla - Abrir la posibilidad de fructificación
31Esquema General de la Investigación Científica
- Elaboración del marco metodológico
- Tipo de investigación
- Definición de población
- Determinación características interés
- Técnicas e instrumentos de medición
- Plan de análisis
- Cronograma de actividades
32Esquema General de la Investigación Científica
- Recolección y procesamiento de los datos
- Presentación y análisis
- Seleccionar un instrumento de recolección
(cuestionarios, boletas, fórmulas, etc.) - Aplicar el trabajo de campo
- Procesamiento de los datos
- Presentar los datos estadísticamente
33El papel de los datos en el proceso de
investigación científica
34Análisis e Interpretación de datosMedidas de
Posición y Variabilidad
- Necesidad de resumir la información
- Conocer la forma de distribución
- Comparación con otros conjuntos
- Grado de homogeneidad del conjunto
35Medidas de Posición
- Medidas de posición y tendencia central
- Las más utilizadas
- la moda (Mo)
- la mediana (Me)
- el promedio
- Percentiles
Cómo elegir que medida de posición utilizará?
36Medidas de Posición
Nivel de medición
Nominal
Ordinal
Moda
Mediana
Intervalo Razón
Percentiles
Promedio
37Medidas de Posición
Datos simples o agrupados
Se trata de datos individuales o distribuciones
de frecuencias ?
38Medidas de Posición
Valor más frecuente en el conjunto
Moda
Para características nominales, ordinales y de
intervalo o razón
39Medidas de Posición
Valor que divide al conjunto en dos partes
proporcionalmente iguales
Mediana
Características ordinales y de intervalo o razón
- Ordenar los datos por magnitud
- Seleccionar el valor central o los valores
centrales según si el número de casos es par o
impar
40Medidas de Posicióncálculo datos simples
Valor que divide al conjunto en dos partes
proporcionalmente iguales
Mediana
Características ordinales y de intervalo o razón
41Medidas de Posición
Valor que relaciona todos los datos de un conjunto
Promedio
Características de intervalo o razón
Sumar los datos y dividir entre el número de casos
42Medidas de Posición cálculo datos simples
Valor que relaciona todos los datos de un conjunto
Promedio
Características de intervalo o razón
43Medidas de Posición
Valores que dividen al conjunto en partes
proporcionalmente complementarias
Cuantilos
Características ordinales y de intervalo o razón
- Ordenar los datos por magnitud
- Determinar la posición de los cuantilos (deciles,
cuartiles, quimtiles, mediana, etc.)
44Medidas de Posición cálculo datos simples
Valores que dividen al conjunto en partes
proporcionalmente complementarias
Cuantilos
Características ordinales y de intervalo o razón
45Medidas de Posicióncálculo datos simples
Se tienen las edades de un grupo de 5 pacientes
hospitalizados 50, 25, 45, 20, 30
Ejemplo
- Ordenar 20, 25, 30, 45, 50
Mo No hay Me30 Promedio34
46Medidas de Posicióncálculo datos simples
Ejemplo
A qué edad corresponde el percentil 25?
- Ordenar 20, 25, 30, 45, 50
- La edad corresponde al valor promedio entre las
posiciones 1 y 2, es decir (2025)/2 22.5
47Medidas de Posición cálculo datos agrupados
Se tienen datos relacionados con el contenido de
proteínas totales del plasma en prematuros
normales de 15 días
Ejemplo
Gramos de proteína por litro
Número de casos
Punto Medio
Frecuencia acumulada
2 6 12 13 5 2 40
40-44 45-49 50-54 55-59 60-64 65-69
42 47 52 57 62 67
2 8 20 33 38 40
48Medidas de Posición datos agrupados
Clase o categoría que contenga la frecuencia más
alta (clase modal)
Moda
Para características nominales, ordinales y de
intervalo o razón
Cuantitativas
49Medidas de Posición cálculo datos agrupados
Ejemplo
Gramos de proteína por litro
Número de casos
Punto medio
Frecuencia acumulada
2 6 12 13 5 2 40
40-44 45-49 50-54 55-59 60-64 65-69
42 47 52 57 62 67
2 8 20 33 38 40
Clase modal
50Medidas de Posicióncálculo datos agrupados
- Valor que divide al conjunto en dos partes
proporcionalmente iguales - Determinar la clase mediana a través de las
frecuencias acumuladas
Mediana
Características de intervalo o razón
51Medidas de Posición cálculo datos agrupados
Ejemplo
Gramos de proteína por litro
Número de casos
Punto medio
Frecuencia acumulada
2 6 12 13 5 2 40
40-44 45-49 50-54 55-59 60-64 65-69
42 47 52 57 62 67
2 8 20 33 38 40
Clase mediana
52Medidas de Posición cálculo datos agrupados
- Valor que relaciona todos los datos de un
conjunto - Determinar el punto medio de cada clase y
ponderar por la frecuencia simple
Promedio
Características de intervalo o razón
53Ejemplo
Medidas de Posición cálculo datos agrupados
Gramos de proteína por litro
Frecuencia por punto medio
Número de casos
Punto medio
2 6 12 13 5 2 40
40-44 45-49 50-54 55-59 60-64 65-69
42 47 52 57 62 67
84 282 624 741 310 134 2,175
54Medidas de Posición cálculo datos agrupados
- Valores que dividen al conjunto en partes
proporcionalmente complementarias - Determinar la clase que contiene el percentil de
interés
Cuantilos
Características de intervalo o razón
55Ejemplo
Medidas de Posición cálculo datos agrupados
Gramos de proteína por litro
Frecuencia acumulada
Número de casos
Punto medio
2 6 12 13 5 2 40
40-44 45-49 50-54 55-59 60-64 65-69
42 47 52 57 62 67
2 8 20 33 38 40
Clase percentil 75
56Medidas de Dispersión
- Medidas de dispersión absolutas y relativas
- Las más utilizadas
- la variancia y la desviación estándar
- el recorrido
- el recorrido intercuartilico
- Coeficiente de variación
- Coeficiente de determinación
Cómo elegir que medida de dispersión utilizará ?
57Medidas de dispersión absoluta
Mide el valor promedio (desvío) en que las
observaciones se apartan de su promedio en
términos absolutos
Desviación estándar
Recorrido
Mide la diferencia máxima entre las observaciones
del conjunto
Recorrido Intercuartílico
Mide la diferencia entre los percentiles 75 y 25
58Medidas de Dispersión
Medida de posición
Moda
Mediana
Recorrido Inter
Promedio
Coeficiente de variación
Variancia
59Medidas de dispersión relativa
Mide el valor promedio (desvío) en que las
observaciones se apartan de su promedio en
términos relativos
Coeficiente Variación
Observe que la variancia no se interpreta, es un
cálculo intermedio para finalmente utilizar la
desviación estándar
60Medidas de dispersión absolutacálculo datos
simples
Por definición
Variancia
Características de intervalo o razón
61Medidas de dispersión absoluta cálculo datos
simples
Por cálculo
Variancia
Características de intervalo o razón
62Ejemplo
Medidas de Dispersióncálculo datos simples
Promedio34
63Medidas de dispersión absolutacálculo datos
agrupados
Por definición
Variancia
Características de intervalo o razón
64Medidas de dispersión absolutacálculo datos
simples
Por cálculo
Variancia
Características de intervalo o razón
65Ejemplo
Medidas de Posición cálculo datos agrupados
Gramos de proteína por litro
Frecuencia por punto medio
Frecuencia por el cuadrado punto medio
Número de casos
Punto medio
2 6 12 13 5 2 40
40-44 45-49 50-54 55-59 60-64 65-69
42 47 52 57 62 67
84 282 624 741 310 134 2,175
3,528 13,254 32,448 42,327 19,220 8,978 119,665
66Ejemplo
Medidas de Posición cálculo datos agrupados
67Medidas de dispersióncálculo datos simples y
agrupados
Otras
Características de intervalo o razón
68Medidas Relativas
Objetivos de esta sesión
- Necesidad de utilizar medidas
- relativas en el análisis estadístico
- Indicadores de mayor uso en las áreas de
- salud y economía
- Limitaciones de los indicadores relativos
- Errores más frecuentes
69Cifras absolutas y relativas
Las cifras absolutas son utilizadas con alta
frecuencia en estadística para la programación de
servicios y formulación de presupuestos. Sin
embargo...
- No permiten comparar fácilmente entre categorías
de un mismo fenómeno, con otras unidades
similares o bien en el tiempo - No es fácil deducir cual fenómeno tiene mayor
importancia o riesgo
70Cifras absolutas y relativas
Las cifras relativas nos facilitan el análisis
- Medición de riesgo y probabilidad de que un
fenómeno x - Importancia relativa del fenómeno en el tiempo,
con respecto a otras unidades similares o con
categorías del mismo fenómeno
71Cifras absolutas y relativas
Indicadores absolutos de uso frecuente
- Número de egresos hospitalarios
- Número de consultas
- Número de partos
- Número de medicamentos
- Número de exámenes de laboratorio.
- Número de camas
- Número de citologías
- Número de placas
- Número de fluroscopías
- Número de ultrasonidos, etc.
72Cifras absolutas y relativas
Indicadores relativos
- Tasas
- Razones
- Porcentajes y/o proporciones
- Indices
frecuencias relativas
73Tasas
- Demográficas
- Económicas
- Financieras
- Bancarias
74Tasas Demográficas
- Número de casos que presentan la característica
de interés (a) - La población expuesta al riesgo de presentar o
adquirir la característica de interés (b) - Referencia a un periodo específico
Factor constante de amplificación
75Tasas Demográficas
- 1. Tasas brutas (generales) No consideran
aspectos de estructura o composición de la
población - 2. Tasas específicas Se refieren a grupos
específicos de la población - 3. Tasas ajustadas Necesarias para medir y
comparar riesgos de distintas poblaciones
76Tasas demográficas de uso frecuente
- Tasa de natalidad
- Tasa de fecundidad global y específica
- Tasa de mortalidad (general e infantil)
- Tasa de mortalidad neonatal, postneonatal
(residual) - Tasa de mortalidad materna
77Tasas Económicas
- Variaciones que ocurren sobre una función f(x)
ante variaciones en la variable X - Referencia a un periodo y lugar específicos
PENDIENTE DE LA CURVA
78Tasas económicas gráficamente
79Tasas económicas de uso frecuente
- Tasas de cambio
- Elasticidad precio de la demanda
- Elasticidad cruzada
- Propensiones marginales
80Tasas Financieras y Bancarias
- Se refiere a cargos o precio que se paga por el
valor del dinero - Beneficio que se obtiene a partir del ahorro o la
inversión - Referencia a un periodo
81Tasas financieras de uso frecuente
- Tasas de interés nominal y real
- Tasa de retorno de la inversión
- Tasa activa y pasiva
- Tasa básica
82Razones
- Relaciona dos cantidades (a y b) de igual o
distinta naturaleza - a no necesariamente es parte de b
- Referencia a un periodo
83Razones de uso frecuentes
- Razón de masculinidad
- Densidad de población
- Producción por habitante
- Consumo por habitante
- Consultas por habitante
- Médicos por habitante
- Exámenes por consulta
84Proporciones o porcentajes
- Relaciona dos cantidades (a y c) de igual
naturaleza - a es necesariamente parte de c
- c se define como ab en el caso más simple
- Referencia a un periodo
85Proporciones de uso frecuentes
- Mortalidad proporcional (sexo, edad, servicios,
especialidades, causas, etc.) - Indice de ocupación
- Cobertura de vacunación
- Deuda interna como porcentaje del PIB
- Déficit fiscal como porcentaje del PIB
86Tasas ajustadas
Necesidad de resumir la información que se ve
afectada por diferencias de magnitud y de
composición (estructura, producción, etc.)
87Indice
- Relaciona una misma variable en momentos
distintos del tiempo. El objetivo es analizar la
variación relativa de la variable en el tiempo
88Tipos de indices
De precios mide el cambio en los precios de una
canasta de bienes y servicios, definida en la
construcción del IPC, de un periodo de tiempo a
otro De cantidad mide cuanto cambia, en términos
de número o de cantidad, una variable en el
tiempo De valor mide cambios en el valor
monetario total originados en cambios en cantidad
o en precio expresado en alguna unidad monetaria,
por lo general dólares.
89Tipos de indices
Agregados no pesados
Agregados pesados
90Cifras absolutas y relativas
Errores frecuentes
- Confusión de la base de comparación
- Cifras absolutas pequeñas
- Omisión de las estructuras y magnitudes
91Presentación de Datos
92Objetivos de esta charla
- Mencionar los aspectos generales de la
presentación escrita de trabajos científicos - Retomar los aspectos formales de la presentación
de datos estadísticos en la investigación
científica.
93Presentación de resultados
- Textual y semitextual
- Cuadros
- Gráficos
94Presentación textual y semitextual
95Presentación en cuadros y gráficos
Qué ? Cuándo ? Cómo ? Dónde ?
título
encabezado columnas
columna matriz
cuerpo del cuadro
característica de clasificación
notas
fuentes de información
96Presentación en cuadros y gráficos
Qué ? Cuándo ? Cómo ? Dónde ?
título
Figura
Característica ? cualitativa o cuantitativa
notas
fuentes de información
97Presentación en gráficos
cualitativa
título
notas
fuentes de información
98Presentación en gráficos
cuantitativa
título
notas
fuentes de información
99Elementos de Inferencia Estadistica
100Objetivos...
- Introducir la inferencia estadística como
herramienta de análisis - Conceptos básicos de probabilidad
- Distribuciones de probabilidad conocidas
- Estimación
- Pruebas de hipótesis
101Vertientes de la Estadística
Descriptiva
Inferencial
102Por qué la Inferencia Estadística ?
Para describir un resultado concreto los métodos
hasta ahora vistos son suficientes. Para
generalizar resultados los métodos analizados
constituyen el inicio y se procederá con la IE
103Estadística inferencial
La que apoyándose en el cálculo de probabilidades
y a partir de datos muestrales, efectúa
estimaciones, decisiones, predicciones u otras
generalizaciones sobre un conjunto mayor de
datos.
104Definición de probabilidad
Grado de incertidumbre asociado a la ocurrencia
de un evento. Este grado es un valor entre 0 y 1
que además puede ser expresado sobre base 100
105Conceptos de probabilidad
Clásica (a priori, Laplace) Es aquella que
relaciona los casos favorables con los casos
posibles. Frecuencia relativa (a posteriori)
Relaciona la frecuencia de ocurrencia de eventos
de una manera expost es decir a partir de la
observación. Subjetiva Señala la percepción
individual y muy propia que posee un individuo
respecto a la ocurrencia de un evento
106Probabilidad clásica (Laplace)
- Ejemplo
- Probabilidad de nacimiento de una niña
- Probabilidad de obtener escudo al lanzar una
moneda
107Probabilidad frecuencia relativa
- Ejemplo De los 1000 entrevistados
- El 25 fueron hombres y el 75 mujeres.
- El 45 de los entrevistados acostumbrar ver
televisión por la noche.
108Probabilidad subjetiva
- Ejemplo
- Será mañana un día soleado?
- Descubriremos una vacuna contra la vejez?
109En que consiste la inferencia ?
Es un proceso de generalización de resultados
Muestra
Población
110Conceptos básicos de probabilidad
El cálculo de probabilidades nos suministra las
reglas para el estudio de los experimentos
aleatorios o de azar, constituyendo la base para
la estadística inductiva o inferencial.
111Experimentos y sucesos aleatorios
Se trata de un suceso aleatorio si 1. Se puede
repetir indefinidamente, siempre en las mismas
condiciones 2. Antes de realizarlo, no se puede
predecir el resultado que se va a obtener 3. El
resultado que se obtenga (e) pertenece a un
conjunto conocido previamente de resultados
posibles.
112Sucesos aleatorios
- Suceso simple Ocurrencia de cada elemento que
conforma el espacio muestral - Sucesos compuestos Unión de eventos simples
- Suceso imposible Conjunto vacío (probabilidad 0)
- Suceso cierto Espacio muestral (ocurrencia con
probabilidad 1)
113Sucesos aleatorios
- Sucesos complementarios Ocurrencia del evento
contrario al evento de interés - Sucesos independientes La ocurrencia de un
suceso no dependen ni se ve afectada por la
ocurrencia de otro suceso
114Sucesos aleatorios
- Sucesos mutuamente excluyentes Dos sucesos no
pueden ocurrir simultáneamente - Sucesos colectivamente exhaustivos Se refiere a
eventos simples cuya ocurrencia define el espacio
muestral E
115Ejemplo
Construya el espacio muestral para el lanzamiento
de una moneda
Solo existen dos resultados posibles
116Ejemplo
- El espacio muestral solo tiene dos sucesos
- e1escudo
- e2corona
- En la probabilidad clásica cada uno de estos
eventos (sucesos) tiene la misma probabilidad de
ocurrir.
2 resultados
117Ejemplo
118Teoremas de probabilidad
B
B
A
A
Eventos no mutuamente excluyentes
Eventos mutuamente excluyentes
119Ejemplo
- A Obtener un número par o
- B Obtener un múltiplo de tres
120Teoremas de probabilidad
No A
A
121Ejemplo
- B Obtener un múltiplo de tres
- Definimos No B No obtener un múltiplo de tres
122Teoremas de probabilidad
- La probabilidad condicional
Si A y B son independientes estadísticamente
entonces P(A/B)P(A)
123Ejemplo
- A Obtener un número par dado
- B Obtener un múltiplo de tres
124Teoremas de probabilidad
- La intersección de dos eventos
Son A y B independientes estadísticamente?
No
P(AB)0
Si
P(AB)P(A)P(B)
125Ejemplo
- A Obtener un número par y
- B Obtener un múltiplo de tres
126Teoremas de probabilidad
- El teorema de la probabilidad total Sean los
eventos A un suceso del espacio muestral y B una
partición de E, se define la probabilidad total
de A como
127Ejemplo
En una escuela se examinan 1500 niños para
analizar su estado nutricional y la relación con
el sexo Cuál es la probabilidad de encontrar un
niño(a) desnutrido(a)?
128Ejemplo
129Teoremas de probabilidad
- Definimos
- A Desnutrición
- B Sexo del alumno
No desnutridos
Desnutridos
Niñas
Niños
130Teoremas de probabilidad
- El teorema de Bayes Se refiere a la probabilidad
de que ocurra un suceso condicionado a la
ocurrencia previa de otro suceso
131Ejemplo
En una escuela se examinan 1500 niños para
analizar su estado nutricional y la relación con
el sexo Cuál es la probabilidad de que al
seleccionar aleatoriamente un alumno sea un niño
dado que su estado nutricional es desnutrido?
132Teoremas de probabilidad
- Definimos
- A Desnutrición
- B Sexo del alumno
- B1 Hombre
- B2 Mujer
No desnutridos
Desnutridos
Niñas
Niños
133Variable aleatoria
Es una variable para la cual existe una
probabilidad determinada de que asuma cierto
resultado conocido (continuo o aislado), pero
que previamente desconocemos el valor de ese
resultado. Denotamos la variable con la letra
mayúscula X y valores específicos con minúscula
x y un subíndice xi
134Función (distribución) de probabilidad
Es una función que asocia a cada valor de la
variable aleatoria X una probabilidad
135Función (distribución) de probabilidad
- Una función de probabilidad siempre será mayor
que 0 y menor que 1 por definición - La suma de la función f(X) para todos los valores
de X debe ser igual a 1 - Una variable aleatoria a través de la función de
probabilidad tiene una valor esperado (promedio)
y una variancia que la identifican
136Distribuciones de probabilidad
- Uniforme
- Bernoulli
- Binomial
- Poisson
- Binomial negativa
- Geométrica
- Hipergeométrica
Discretas
137Distribuciones de probabilidad
- Normal
- T-Student
- F-Fisher
- Chi cuadrado
Continuas
138Distribución Bernoulli
Describe las probabilidades de ocurrencia en un
único evento cuyo espacio muestral tiene solo dos
resultados posibles
evento bernoulli (dicotómico)
Evento simple
139Distribución Bernoulli
Características de los procesos Bernoulli 1.
Cada repetición es independiente 2. El resultado
en cada repetición tiene solo dos opciones (éxito
o fracaso) 3. La probabilidad de ocurrencia de
cada evento (resultado) es igual en cada
repetición
140Distribución Bernoulli
Matemáticamente la distribución de Bernoulli se
expresa como
Para x0,1
141Ejemplo
- En un grupo de pacientes la probabilidad de que
la enfermedad A esté presente es p0.2 - Cuál es la probabilidad de que un paciente
seleccionado al azar presente la enfermedad A?
142Ejemplo
- En un grupo de pacientes la probabilidad de que
la enfermedad A esté presente es p0.2
Determine la probabilidad del siguiente evento
O en un grupo de 5 pacientes, el primero y el
último tengan la enfermedad A
143Distribución Geométrica
Describe las probabilidades de ocurrencia en n
fracasos hasta la ocurrencia de un único éxito
Evento compuesto
evento geométrico
144Distribución Geométrica
Matemáticamente la distribución de geométrica se
expresa como
Para x0,1,...
145Ejemplo
- En un grupo de pacientes la probabilidad de que
la enfermedad A esté presente es p0.2
Determine la probabilidad del siguiente evento
O revisar 5 pacientes, y el último tengan la
enfermedad A
146Distribución Binomial negativa
Describe las probabilidades de ocurrencia de x
fracasos y r-1 éxitos condicionado a que la
última repetición sea éxito
Evento compuesto
evento binomial negativa
147Distribución Binomial negativa
Matemáticamente la distribución de geométrica se
expresa como
Para x0,1,...
148Ejemplo
- En un grupo de pacientes la probabilidad de que
la enfermedad A esté presente es p0.2
Determine la probabilidad del siguiente evento
O revisar 5 pacientes, antes de encontrar el
tercer paciente que tengan la enfermedad A
149Distribución Binomial
Describe las probabilidades de ocurrencia en
eventos Bernoulli sucesivosInteresa el número
de éxitos obtenidos en n repeticiones sin
considerar el orden
Evento compuesto
evento binomial
150Distribución Binomial
Matemáticamente la distribución de Binomial se
expresa como
Para x0,1,,n
151Ejemplo
- En un grupo de pacientes la probabilidad de que
la enfermedad A esté presente es p0.2
Determine la probabilidad del siguiente evento
O revisar 5 pacientes, encontrar tres
pacientes que tengan la enfermedad A
152Distribución Poisson
Describe las probabilidades de ocurrencia de
eventos discretos relacionados con el tiempo,
volumen o áreas Interesa el número de casos
esperado en un intervalo de tiempo
evento poisson
153Distribución Poisson
Matemáticamente la distribución de Poisson
expresa como
Para x0,1,...
154Ejemplo
- Las llamadas telefónicas de auxilio ingresan a la
central 911 mediante un proceso poisson con un
promedio de 2.7 llamadas por minuto - Determine la probabilidad del siguiente evento
O En el próximo minuto no ingresen llamadas
155Ejemplo
- Determine la probabilidad del siguiente evento
O En los próximos 5 minutos ingresen 2 llamadas
156Distribución Normal
Evento normal
Describe el comportamiento de variables continuas
que tienen altas frecuencias en los valores
centrales y bajas frecuencias en los
extremos Esta distribución describe una gran
cantidad de fenómenos en distintos campos
157Distribución Normal
Características
- El valor del promedio se ubica en el centro de la
distribución - Presenta condiciones de simetría
- Las medidas de posición son coincidentes
- El 95 del área bajo la curva se encuentra a dos
desviaciones estándar - El 68 del bajo la curva se encuentra a una
desviación estándar
158Distribución Normal
Importante
- La distribución normal queda definida por la
media y la variancia - En consecuencia, existe infinito número de
distribuciones normales - Necesidad de estandarizar
159Distribución Normal
Estandarización
- Conociendo la media y la varianza, aplicar una
transformación a valores estandarizados
contenidos en el intervalo (-3,3) en el 99 de
los casos
160Distribución T-Student
- Similar a la Distribución Normal
- Su utilidad es
- Cuando la varianza es desconocida y la muestra
menor de 30 - Muestra menor de 30 (normal o aproximadamente
normal) con varianza conocida
161Distribución T-Student
- El parámetro que la identifica son los grados de
libertad - Existen tabulaciones de los valores de la
distribución bajo niveles de confianza
(significancia) y grados de libertad determinados
162Distribución Chi Cuadrado
- Es un caso particular de la familia de
distribuciones gama
- Su utilidad es
- Pruebas de asociación entre variables
- Pruebas de bondad de ajuste (esperado vs
observado)
163Distribución Chi Cuadrado
- El parámetro que la identifica son los grados de
libertad n, esto determina la media y la
varianza
- Existen tabulaciones de las valores de la
distribución bajo niveles de confianza
(significancia) y grados de libertad determinados
164Estimación
Puntual
Medidas de posición
Intervalos de Confianza
Intervalo
165Estimación por intervalo
- Elementos a considerar en la elaboración de
estimaciones de intervalo - Precisión
- Confianza de las estimaciones
- Tamaño de muestra
- Varianza (conocida o desconocida?)
166Estimación por intervalo
- Es la probabilidad de que el verdadero valor
poblacional esté contenido en el intervalo
167Estimación por intervalo
- Estimación para la proporción P
Valores muestrales
168Estimación por intervalo
- Estimación para la media ?
Valores muestrales
Varianza conocida
169Estimación por intervalo
- Estimación para la media ?
Valores muestrales
Varianza desconocida
Muestras menores de 30
170Hipótesis
- Posible respuesta a un problema
- Estadísticas y de Trabajo
- Objetivas y operacionalizables
- Univariadas y multivariadas
171Tipos de hipótesis
- Respecto a los parámetros que describen la
distribución - Asociación
- Una población
- Dos poblaciones
Cómo probar una hipótesis?
172Errores asociados a una hipótesis
Decisión
Hipótesis
Verdadera
Falsa
Correcto
No Rechaza
Error II
Correcto
Error I
Rechazar
173Proceso de prueba de hipótesis
- 1. Planteamiento de la hipótesis
- Hipótesis de nulidad
- Hipótesis alternativa
174Proceso de prueba de hipótesis
- Nivel de significancia y nivel de confianza
- Zona de rechazo significancia
- Zona de no rechazo confianza
175Proceso de prueba de hipótesis
- 3. Establecimiento del punto de decisión
- Zona de rechazo significancia
- Zona de no rechazo confianza
Zona de No Rechazo
Zona de rechazo
176Proceso de prueba de hipótesis
- 4. Selección del método de prueba
- Intervalo de confianza
- Estadístico de prueba
- Estadístico y el intervalo de prueba dependen de
la hipótesis planteada - Z calculado
- T calculado
- F calculado (Análisis de variancia)
177Proceso de prueba de hipótesis
- 5. Interpretación de los resultados
- Rechazo o no rechazo de la hipótesis nula
conforme a la evidencia - Interpretación en términos del problema
178Proceso de prueba de hipótesis
Cómo construir el estadístico o el intervalo de
confianza para la prueba?
179Prueba de hipótesis
- Tipo de hipótesis
- Univariada
- Asociación
- Una población
- Dos poblaciones
- Planteamiento de la hipótesis
- Hipótesis de nulidad
- Hipótesis alternativa
180Prueba de hipótesis
- Nivel de significancia
- Zona de rechazo
- Zona de no rechazo
- Selección del método
- Intervalo de confianza
- Estadístico de prueba
- Intervalo de confianza dependiendo de la
hipótesis planteada - Intervalo para p
- Intervalo para ?
181Prueba de hipótesis
- Estadístico de prueba dependiendo de la hipótesis
planteada - Z calculado
- T calculado
- Chi calculado
- Interpretación de los resultados
- Rechazo o no rechazo de la hipótesis nula
conforme a la evidencia - Interpretación en términos del problema
182Prueba de hipótesis
- Prueba para la proporción P
Nula
Alternativa
183Prueba de hipótesis
- Prueba para la media ? (varianza conocida y n
mayor de 30
Nula
Alternativa
184Prueba de hipótesis
- Prueba para la media ? (varianza desconocida y
n menor de 30
Nula
Alternativa
Si ngt30 Tcal tiende a la norma
185Prueba de hipótesis
- Prueba para la asociación de dos variables
- Ho No existe asociación entre las
características - H1 Las características están asociadas
186Prueba de hipótesis
- Prueba para la proporción P
Nula
Alternativa
187Prueba de hipótesis
- Prueba para la media ? (varianza conocida y n
mayor de 30
Nula
Alternativa
188Prueba de hipótesis
- Prueba para la media ? (varianza desconocida y
n menor de 30
Nula
Alternativa
Si ngt30 Tcal tiende a la normal
189Análisis de regresión y Correlación
190Objetivos
- Exponer una herramienta de análisis de modelación
y predicción de uso frecuente dentro de la
investigación científica - Evidenciar los objetivos teórico-prácticos en
modelos de regresión - Analizar los supuestos del modelo
191Objetivos del modelo
- Predicción
- Modelación
- Relaciones de dependencia
Establecer una relación matemática entre una
variable dependiente y una o más variables
independientes
192Bases del Modelo
- Variable dependiente (Y)
- Es la variable que interesa modelar y se supone
existe alguna relación con las variables del
modelo
193Bases del Modelo
Variable independiente (X) Es aquella variable
que cambia o varía libremente y en la cual la
variable Y no tiene impacto.
194Bases del Modelo
Constante
Coeficiente de regresión
195Supuestos del modelo
- Variable X es fija
- El error asociado a cada valor x es
estadísticamente independiente y siguen una
distribución normal con media cero - El conjunto de observaciones de Y siguen una
distribución normal para un valor dado de X
196Estimación de la recta
Pendiente negativa (blt0)
Pendiente positiva (bgt0)
Asociación lineal entre X y Y
197Formulas de estimaciónCoeficientes de regresión
198Formulas de Ajuste y asociación
Bondad de ajuste
Grado de asociación
199Ejemplo
Se tienen los datos el PIB real, CP real en
millones de dólares y el IPC base 95, para
Alemania entre 1990 y 1998
200Matriz de correlación
201Ajuste de la recta de regresión
202Confianza del modelo
203Tendencia lineal entre PIB y CP en términos
reales. 1990-1998
204Diagrama de dispersión PIB y CP
205Diagrama de dispersión PIB y CPAjuste lineal