Title: Diapositiva 1
1Tema.4. Medidas de posición. Medidas de posición
individual, centiles. Medidas de posición grupal.
Concepto de tendencia central. Media, mediana y
moda. Propiedades. Resistencia y robustez.
Medidas robustas de la tendencia central.
2Medidas de posición individual centiles
Los centiles dividen la distribución (ordenada)
de datos en 100 partes. Cada parte contiene 1/100
de las puntuaciones. El Centil 60, por ejemplo,
es aquella puntuación que deja por debajo de sí
el 60 de los datos. El Centil 15 es aquella
puntuación que deja por debajo de sí el 15 de
los datos. Los centiles son cuantiles que
dividen la distribución en 100 partes. Hay otros
cuantiles. Uno de ellos es la mediana, que divide
la distribución en dos partes (MedianaCentil
50) Otros cuantiles son los deciles (Decil
1Centil 10) y los cuartiles (Cuartil 1Centil
25, Cuartil 2 Mediana, Cuartil 3Centil 75)
3Medidas de posición individual centiles
Cálculo de centiles
Centil k
Posición de Orden
Mediana (Centil 50)
Posición de Orden
NOTA el cálculo lo veremos con datos
individuales, y no con datos agrupados
4Medidas de posición grupal. Concepto de tendencia
central.
Nos indican un valor representativo del grueso de
los datos, de la referencia de los mismos un
valor central. Ejemplo con las calificaciones
4,7,5,6,5,4,5,5,5,6,5,4,4, es claro que (a ojo)
están en torno a cinco, que podría ser tomado
como índice de tendencia central.
Veremos primero los 3 índices de tendencia
central más comunes (moda, media y mediana).
Después veremos otros índices que han sido
propuestos.
5Media aritmética
Fórmula
Simplemente se trata de sumar todos los valores y
dicha cantidad se divide por el número de valores
que tengamos.
Si tenemos los datos 4,6,5,3,7 La media será
(46537)/54
Nota se pueden emplear medias aritméticas
ponderadas. Pensemos que hay 2 datos, uno (5)
pesa 06 y el otro (6) pesa 04. Entonces, la
media será (506604)/(0604)54
6Propiedades de la Media aritmética
-La suma de diferencias (de todos los valores)
respecto a la media es siempre 0 -Si sumamos una
constante a cada uno de los valores, la nueva
media aritmética resultante será la original más
la constante. -Si multiplicamos cada uno de los
valores por una constante, la nueva media
aritmética será la original por la constante.
- Minimiza la suma de diferencias en términos
cuadráticos.
7Mediana
La Mediana (Mdn o Md) se define como el valor que
tiene la propiedad de que el número de
observaciones menores que él es igual al número
de observaciones mayores que él. Por ejemplo, en
la secuencia (ordenada) 3,4,5,6,7,8,9 la mediana
será 6 En la secuencia (ordenada) 2,3,4,6,7,9 la
mediana será 5 (la media aritmética entre los dos
valores centrales observad que n es par en el
ejemplo de arriba era impar)
8- Propiedades de la mediana
- No utiliza todos los elementos
- Se puede calcular con datos ordinales
- Se ve menos afectada por datos atípicos que la
media aritmética. - Minimiza la suma de diferencias en valor absoluto
(recordad que la media aritmética minimizaba la
suma de diferencias en términos cuadráticos)
9Ejemplo uso de la mediana Los 9 empleados de una
nueva empresa viven al lado de la Nacional 340 en
diferentes kilómetros
3
2
1
2
1
Núm. Emp.
Km 1 4 5 6
26
Dado que todos viajan en coche, y sabiendo que
quieres minimizar el coste en gasolina, en qué
lugar pondrías la empresa para minimizar tal
coste?
10La moda
Se define como Moda (Mo) aquel valor de la
variable al que corresponde mayor frecuencia. En
el conjunto de datos 4,5,6,6,3,6,4,5 la
Mo6 Propiedades -No es necesariamente única
(puede haber varias modas) -Se puede calcular con
datos en escala nominal -En su cálculo no
intervienen todos los elementos
11Cuál elegir?
Media
Moda
Mediana
12Resistencia y robustez
Estadísticos resistentes Son aquellos que no se
ven influidos (o solo ligeramente) por pequeños
cambios en los datos. Evidentemente, la media es
un estadístico muy poco resistente a cambios en
los datos, dado que se ve influida por todos y
cada uno de ellos. La mediana, en cambio, es un
estadístico altamente resistente.
13Estadísticos (Estimadores) robustos (ESTADÍSTICA
INFERENCIAL) Son aquellos estadísticos
(estimadores) que funcionan bien para varios
tipos distintos de distribuciones teóricas,
aunque pueden no ser el mejor estimador para
ningún tipo concreto de distribución. Es decir,
son el mejor compromiso.
La media no es un estimador robusto. La mediana
es un estimador más robusto que la media, si bien
hay otros estimadores más robustos que veremos en
el punto siguiente del temario.
14Medidas robustas de tendencia central
1. Medias Recortadas
Consiste en calcular la media aritmética sobre un
subconjunto central del conjunto de datos, no
considerándose una determinada proporción p por
cada extremo. (p se expresa normalmente como
porcentaje). Por ejemplo, una media recortada al
40 en una secuencia de 10 datos implica no tener
en cuenta ni los 4 valores menores ni los 4
valores mayores. Observar que la media recortada
al 0 es la media aritmética. A la media
recortada al 25 se la denomina centrimedia.
15Medidas robustas de tendencia central
1. Medias Recortadas (cont)
Calcula la media recortada al 5 de los
siguientes datos 3, 4, 4, 5, 5, 6, 7, 8, 9,
11 El valor debe ser 6.11 Calcula la media
recortada al 10 de los datos anteriores (da
6) Calcula la centrimedia (da 5.8)
16Medidas robustas de tendencia central
2. Media Winsorizada
Es análogo a las medias recortadas excepto en que
las puntuaciones eliminadas, ya no lo son sino
que se sustituyen por los valores menor y mayor
que quedan para el cómputo de la media
winsorizada. Así, en la media recortada a nivel 2
implicaría eliminar las dos puntuaciones mayores
y las 2 menores 3, 4, 4, 5, 5, 6, 7, 8, 9, 11 Y
quedan los datos 4, 5, 5, 6, 7, 8 y se calcula
la media de los mismos En la media winsorizada,
los datos 3 y 4 (los dos menores) y el 9 y 11
(los dos mayores) se sustituyen por 4 y 8
respectivamente. Es decir, 4, 4, 4, 5, 5, 6, 7,
8, 8, 8 y se calcula la media de los mismos, que
será la media winsorizada a nivel 2 (debe de dar
5.9)
17Medidas robustas de tendencia central
3. Otros tipos de media en la que se recortan
datos
En muchas ocasiones lo que se hace es emplear un
valor mínimo y uno máximo más allá del cual se
eliminan los datos que sobrepasen tales
valores. Por ejemplo, en experimentos de tiempo
de reacción para discriminar palabras/pseudopalabr
as se pueden eliminar datos menores de 200 ms y
mayores de 1500 ms. (Menos de 200 ms es demasiado
rápido más de 1500 ms es demasiado lento.) De
esta manera, si todos los datos están en el rango
200-1500 ms no se elimina ningún dato
18Medidas robustas de tendencia central
4. Trimedia
Es un índice de tendencia central que consiste en
calcular una media aritmética ponderada de tres
medidas, la Mediana (con peso doble) y el primer
y tercer cuartil. Pensemos que en un conjunto de
datos, el primer cuartil es 51, la mediana es 55
y el tercer cuartil es 63. La trimedia es
19Medidas robustas de tendencia central
5. Otras medidas robustas El estimador-M de
Huber, el estimador biponderado de Tukey, el
estimador M-redescendente de Hampel y el
estimador en onda de Andrew. Estos estimadores se
diferencian entre sí por el tipo de ponderación
aplicada sobre los datos. Por ejemplo, en el
Estimador-M de Huber (Estimador M de posición)
Las puntuaciones típicas que sean menores que una
constante, reciben un peso de 1. Los casos que
tienen los mayores valores absolutos tienen pesos
tanto más pequeños cuanto mayor es su distancia
respecto a cero. La constante es
1.339. Cálculo lo da el SPSS.