Title: Diapositiva 1
1DIPLOMADO DE ESPECIALIZACION DE POSTGRADO EN
ASESORIA DE TESIS
PROMEDIOS
DR CARLOS CALDERON CABADA
2OBJETIVOS
Al finalizar la Tema 5, el participante será
capaz de
- Diferenciar los diversos tipos de medidas de
resumen que se pueden aplicar a un conjunto de
datos - Calcular e interpretar las principales medidas de
tendencia central
3CONTENIDO
- La estadística de resumen
- Propiedades de la sumatoria
- Principales medidas de tendencia central
- 3.1 Medias
- 3.2 Mediana
- 3.3 Moda
- 3.4 Cuartiles
- 3.5 Percentiles
45.1 La estadística de resumen
- Después de construir tablas y gráficos, a partir
de una colección de datos, se requieren medidas
más exactas. - La estadística de resumen, proporciona medidas
para describir un conjunto de datos. - Existen tres tipos de medidas de resumen
- De tendencia central.
- De dispersión.
- De la forma de la distribución.
5(A) Las medidas de tendencia central
- Se refieren al punto medio de una distribución
- Se conocen como medidas de posición
- Ejemplo A partir del gráfico siguiente, se
observa que la posición central de la curva B
está a la derecha de la posición central de las
curvas A y C. Observese que la posición central
de la curva A es la misma que la curva C.
6(B) Las medidas de dispersión
- Se refieren a la extensión o amplitud de los
datos de una distribución - Representan el grado de variabilidad de los
datos. - Ejemplo Observe que la curva A en el siguiente
gráfico tiene una mayor dispersión que la curva
B, a pesar que la posición central es la misma.
7(C) Las medidas de la forma de la curva
- Las curvas que representan a un conjunto de
datos, pueden ser analizadas de acuerdo a su - a) Simetría b) Curtósis
- Las curvas simétricas, tienen una forma tal que
con una línea vertical que pase por el punto más
alto de la curva, dividirá el área de esta en dos
partes iguales.
8- Las curvas sesgadas son aquellas cuyos valores
están concentrados en el extremo inferior o
superior de la escala de medición del eje
horizontal. La cola indica el tipo de sesgo.
9- Cuando medimos la curtósis nos referimos al
grado de agudeza. Pueden ser leptocúrtica
(concentración al centro) mesocúrtica
distribuidos simétricamente) o platicúrtica
(aplanada).
105.2 Propiedades de la sumatoria
- 1ra Regla La suma de los n términos de una serie
constante, es igual a n veces la constante.
Ejemplo C 10, n3 10 10 10 3
(10) 30
11- 2da Regla La suma de los productos de una
constante por una variable, es igual a la
constante multiplicada por la suma de la
variable.
Ejemplo C 5, X1 2, X2 4, X3
6 5(2) 5(4) 5(6) 60
12- 3ra Regla La suma de los valores de una variable
más una constante es igual a la suma de los
valores de la variable más n veces esa constante. -
Ejemplo C 2, x1 5, x2 3, x3 2 (5
2) (3 2) (2 2) 16 (5 3
2) 3(2) 16
135.3 Las medidas de tendencia central
- 1. En general se denominan promedios.
- 2. Los más importantes son la media, la mediana y
la moda. - Aritmética
- Media Geométrica
- Medidas de Mediana Armónica
- tendencia central Moda
- 3. También es útil conocer los percentiles (o
fractiles).
14POR QUÉ SON IMPORTANTES LAS MEDIDAS DE TENDENCIA
CENTRAL? Porque la mayor parte de los conjuntos
de datos muestran una tendencia a agruparse
alrededor de un dato central. Las medidas de
tendencia central son puntos en una distribución,
los valores medios o centrales de ésta y nos
ayudan a ubicarla dentro de la escala de medición.
155.3.1 La Media
- (A) La media aritmética ( )
- a) Obtención Se obtiene sumando los valores
registrados y dividiéndolos entre el número
de datos. - Ejemplo
- La siguiente tabla muestra el número de
reclamos y quejas presentadas por pacientes en
el Servicio de Emergencias a lo largo de una
semana. Calcule e interprete la media.
16- Media aritmética
- 10 reclamos
- b) Interpretación Si elige al azar un día de la
semana, se espera que los pacientes del servicio
de emergencia realicen 10 reclamos en ese día. - c) Simbología
- Tamaño Media aritmética
- Muestra n (equis
barra) - Población N ? (mu)
17- d) Cálculos a partir de datos no agrupados, se
- utilizan las siguientes formulas.
- Para una muestra
- donde media muestral
- suma de todos los datos
- número de datos
(muestra)
Para una población donde ?
media poblacional suma de
todos los datos número de datos
(población)
N
18Se puede calcular la media aritmética utilizando
Excel.
Media aritmetica
19- e) Cálculo a partir de datos agrupados.
- El cálculo de la media aritmética, cuando los
datos disponibles se encuentran en tablas de
distribución de frecuencias, se realiza
utilizando la formula siguiente -
- donde media muestral
- frecuencia absoluta de la clase i
- marca de la clase i
20- Ejemplo
- La distribución de frecuencias siguiente,
representa los puntajes obtenidos en una
evaluación del desempeño, aplicado al personal
técnico de un Centro de Salud. El puntaje máximo
en la prueba es 50. Calcule e interprete en media.
21Primero se calcularán las marcas de clase (
) es decir, el valor intermedio de cada
clase Marca de Frecuencia
clase ( ) absoluta(fi) 12 -
16 14 4 17 - 21 19 8 22 -
26 24 15 27 - 31 29 23 32 - 36
34
10 Total 60 14(4) 19 (8) 24
(15) 29 (23) 34 (10) 4 8 15 23
10
clase
1575 60
26.25
22- Interpretación Si se elige al azar a un
trabajador técnico de este hospital, se espera
que tenga un puntaje de 26,25 en su evaluación de
desempeño.
f) La media aritmética ponderada (
) donde factor de
ponderación datos
23- Ejemplo Una empresa comercializadora de Seguros
Médicos dispone de 3 representantes para la zona
de Miraflores, cada uno de los cuales cobra
diferente comisión por póliza vendida, y realiza
diferente número de contratos. Calcule e
interprete el valor medio de la comisión
24- Interpretación
- Si se elige al azar un representante se espera
que cobre una comisión de 38.67 por póliza
vendida.
25- g)Ventajas y desventajas de la media aritmética
- Ventajas
- Concepto familiar para muchas personas
- Es única para cada conjunto de datos
- Es posible comparar medias de diferentes
muestras - Desventajas
- Se ve afectada por los datos extremos
- Si la muestra es grande y los datos no están
agrupados, su cálculo es tedioso - Si los datos están agrupados en clases con
extremos abiertos, no es posible calcular la
media.
26(B) La media geométrica ( )
- Se utiliza para calcular tasas medias de
variación, como la tasa media de crecimiento
poblacional, la tasa media de inflación mensual,
la tasa media de mortalidad, entre otros. - a) Obtención Se obtiene extrayendo la raíz
enésima del producto de los n valores de
una serie.
27- Ejemplo
- La siguiente tabla muestra la tasa de aumento en
las quejas durante los últimos meses. Calcule e
interprete la tasa media mensual.
La tasa 2,6 también se puede expresar como 0,026
, y puesto que se refiere a un aumento a partir
de una base de 100, el factor de variación será
1,026. Para los otros datos se opera igual.
28b) Cálculos
- Por lo tanto, la media geométrica se calcula
Tasa media de variación
29 (1,0272540 - 1) x 100 2,72
- c) Interpretación
- Si se selecciona al azar un mes entre enero y
mayo, se espera que las ventas se hayan
incrementado 2.72 con respecto al mes anterior.
30(C) La media armónica ( )
- Se utiliza para calcular el tiempo medio,
velocidad y aceleración media, como por ejemplo,
el tiempo medio para realizar determinada
cirugía. - a) Obtención se obtiene calculando el inverso de
la media aritmética de los inversos de una
serie.
31- Ejemplo
- Los siguientes datos registran el tiempo que
utilizan cuatro médicos al realizar una cierta
intervención quirúrgica. Calcule e interprete el
tiempo medio.
Conocer el tiempo medio permite contar con una
herramienta útil en la planeación de los
recursos, como la Sala de Operaciones. Además de
poder comparar nuestro desempeño con los
estándares de calidad internacionales.
32 - b) Interpretación
- Si se selecciona al azar a uno de los cuatro
médicos, se espera que realice este tipo de
cirugía en 43 minutos aproximadamente.
335.3.2 La Mediana
- Es la medida que divide en dos subconjuntos
iguales a datos, de tal manera que 50 de los
datos es menor a la mediana y el otro 50 es
mayor a la mediana. - a) Obtención Se obtiene ordenando la serie de
datos (en forma ascendente o descendente) y
ubicando el dato central.
34- Ejemplo
- Los siguientes datos se refieren al número de
pacientes que llegaron a su cita, después de la
hora programada durante los últimos 11 días en el
Servicio de Pediatría. Calcule e interprete la
mediana. - 12, 10, 5, 15, 8, 11, 13, 8, 10, 17, 16
- Primero se ordenan lo datos
- 5, 8, 8, 10, 10, 11, 12, 13, 15, 16, 17
- 5 datos menores 5 datos mayores
mediana
35- b) Interpretación Durante 5 días llegaron menos
de 11 pacientes tarde a su cita y durante 5 días,
más de 11 pacientes llegaron tarde a su cita. - c) Reglas
- 1º Si la serie es impar, la mediana ocupa el
lugar central de la serie previamente ordenada. - Ejemplo 5, 10, 10, 12, 15 , 17, 20, 21, 24
362º Si la serie es par, la mediana se obtiene de
la semisuma de los dos valores centrales de la
serie previamente ordenada.
- Ejemplo
- 8, 10, 14, 18, 23, 24, 32, 34
- 3º Sea la serie par o impar, la mediana ocupa el
lugar ,de la serie previamente
ordenada.
37- d) Cálculo a partir de datos agrupados.
- donde
-
- mediana
- limite real (o frontera) inferior de la clase
- mediana.
- número total de datos.
- suma de todas las frecuencias hasta, pero
- sin incluir, la clase mediana.
- frecuencia de la clase mediana
- amplitud de clase
38- Ejemplo La tabla siguiente muestra la
experiencia laboral (años) del personal de
seguridad que labora en un gran hospital. Calcule
e interprete la mediana.
Lugar de la mediana
Mediana 10,5 años
39Interpretación La mitad del personal de
seguridad que labora en este hospital tienen una
experiencia laboral igual o menor a 10 años 6
meses. La otra mitad de este personal tiene una
experiencia laboral igual o mayor a 10 años y 6
meses.
40- e) Ventajas y desventajas
- Ventajas
- Los valores extremos no afectan a la mediana como
en el caso de la media aritmética. - Es fácil de calcular, interpretar y entender.
- Se puede determinar para datos cualitativos,
registrados bajo una escala ordinal. - Desventajas
- Como valor central, se debe ordenar primero la
serie de datos. - Para una serie amplia de datos no agrupados, el
proceso de ordenamiento de los datos demanda
tiempo y usualmente provoca equivocaciones.
415.3.3 La Moda
- La moda es el valor que más se repite dentro de
un conjunto de datos. - a) Obtención se obtiene organizando la serie de
datos y seleccionando el o los datos que más se
repiten.
Ejemplo
4, 5, 7, 8, 8 , 10, 12, 15 4, 7, 12,12 , 15, 16,
20, 20 , 24, 27 7, 12, 15, 18, 25, 30, 31, 38
42- b) Cálculo a partir de datos agrupados
- donde
- moda
- limite real (o frontera) inferior de la clase
- modal (la de mayor frecuencia)
- frecuencia de la clase modal menos la
- frecuencia de la clase anterior
- frecuencia de la clase modal menos la
- frecuencia de la clase siguiente
- amplitud de clase
43- Las clases mediana y modal pueden coincidir pero
conceptualmente son diferentes. - Ejemplo La tabla siguiente muestra los errores
de facturación durante un mes, en una Clínica.
Calcule e interprete la moda. - Interpretación Durante un mes, el número más
frecuente de errores de facturación en esta
clínica es 6.
Clase moda (4 - 7) Mo 5,9
44- e) Ventajas y desventajas de la moda.
- Ventajas
- Se puede utilizar tanto para datos cualitativos
como cuantitativos. - No se ve afectada por los valores extremos.
- Se puede calcular, a pesar de que existan una o
más clases abiertas. - Desventajas
- No tiene un uso tan frecuente como la media.
- Muchas veces no existe moda (distribución
amodal). - En otros casos la distribución tiene varias
modas, lo que dificulta su interpretación.
455.3.4 Los Percentiles
Son los valores que dividen en 100 partes iguales
a un conjunto de datos a) Cálculo para datos
agrupados.
46donde percentil el
percentil buscado número de datos
frecuencia acumulativa hasta la
clase anterior a la clase donde se
ubica el percentil K frecuencia
absoluta de la clase donde se ubica el
percentil K amplitud de clase
47Ejemplo La tabla muestra la experiencia (en
años) de las enfermeras de un gran centro
hospitalario
48Sobre qué edad se ubica el 25 de las
enfermeras de mayor experiencia?
75
25
P75
Menor Experiencia
Mayor Experiencia
K 75
Para saber en cuál clase se halla este dato, se
calculó la frecuencia acumulativa.
49F248
En esta clase se localizan del 249º - 288º
Interpretación Para que una enfermera esté
comprendida dentro del 25 de mayor experiencia
laboral debe tener al menos 15 años, 7 meses y 24
días.
50Hoja de Comprobación
517. Cuando se trabaja con datos agrupados, podemos
calcular una media aproximada si suponemos
que cada valor de una clase dada es igual a su
punto medio
8. El valor que más se repite en un conjunto de
datos se conoce como media aritmética
9.Para un arreglo de datos con 50 observaciones,
la mediana será el valor de la observación numero
25 del arreglo
10.La desviación estándar se mide en las mismas
unidades que las observaciones del conjunto de
datos
11.La varianza indica la distancia promedio de
cualquier observación del conjunto de datos con
respecto a la media
5212. Si la curva de una cierta distribución tiene
el extremo mas largo hacia la izquierda de
la escala de medición del eje horizontal, se
dice que la distribución esta negativamente
sesgada
13.Después de agrupar un conjuntos de datos en un
cierto numero de clases, podemos identificar la
clase mediana como la que tiene el mayor numero
de observaciones
14.Una media calculada a partir de un conjunto de
datos agrupados siempre da una buena estimación
del valor real, aunque rara vez es exacto
15.Podemos calcular una media para cualquier
conjunto de datos, si se nos da su distribución
de frecuencias
16.La moda siempre se encuentra en el punto mas
alto de una gráfica de un arreglo de datos
17. El numero de elementos de una población se
denota con n
5318.Los valores extremos de un conjunto de datos
tienen un fuerte efecto sobre la mediana
19.La diferencia entre las observaciones mas alta
y mas baja de un conjunto de datos se conoce como
media geométrica
20.La dispersión de un conjunto de datos da una
cierta visión de la confiabilidad de la medida de
tendencia central
21.La desviación estándar es igual a la raíz
cuadrada de la varianza
22. .La diferencia entre las observaciones mas
alta y mas baja de un conjunto de datos se conoce
como el alcance cuartil
23. El alcance intercuartil esta basado solamente
en dos valores tomados del conjunto de datos
54(No Transcript)
55(No Transcript)