Title: Diapositiva 1
1Tema.5.Variabilidad. Concepto. Principales
estadísticos varianza, cuasivarianza y
desviación típica y cuasidesviación.
Características. Otras medidas de variabilidad.
Medidas robustas de variabilidad.
2Concepto de variabilidad En el tema anterior
vimos las medidas de tendencia central (media,
mediana, etc). Claramente, para saber cuán
representativo es el valor de tal medida de
tendencia central es necesario tener una medida
de variabilidad. Por ejemplo, alguien puede
tener una media de 5 con los siguientes datos (5,
4, 6, 5, 5) y otro tener una media de 5 con los
datos (10, 0, 5, 9, 1). Evidentemente el primer
sujeto es mucho más consistente, muestra menos
variabilidad.
3Cómo podemos medir la variabilidad? Una primera
estrategia sería emplear la fórmula
El problema es que siempre vale cero.... Una
segunda estrategia es emplear valores absolutos
Esta es la llamada Desviación Media, cuyo
problema es que lo problemático del uso de
valores absolutos.
qué nos queda, pues? Emplear la suma de
diferencias al cuadrado....Es el primer paso para
la varianza
4Varianza
Fórmula
Como veremos en el segundo semestre (Estadística
inferencial), la varianza es un estimador sesgado
de la varianza poblacional por ello se prefiere
el uso de la cuasivarianza que es igual que la
varianza excepto en que se divide por n-1 la
cuasivarianza es un estimador insesgado de la
varianza poblacional
5Desviación típica y cuasidesviación típica
Fórmulas
Una ventaja obvia de la desviación típica sobre
la varianza es que la desviación típica viene
dada en las mismas unidades de medida que los
datos originales (en la varianza las unidades
están al cuadrado). Por eso, en estadística
descriptiva se suele dar la media acompañada de
la (cuasi)desv.típica, más que con la
(cuasi)varianza. NOTA El SPSS cuando indica
varianzas o desviaciones típicas, en realidad
calcula cuasivarianzas y cuasidesviaciones típicas
6- Algunas propiedades de la varianza y desviación
típica - La varianza y la desv. Típica son valores
esencialmente positivos. - (Observad que las diferencias sobre la media
están al cuadrado) - 2. Ni la varianza ni la desv.típica se alteran
cuando a los datos se les añade una constante a.
Entonces, sabemos que
7Entonces, sabemos que
Claro está que lo mismo se aplica a la
desv.típica (y a la cuasivarianza y la
cuasidesv.típica
83. Si los datos se multiplican por una constante
a cualquiera, la desv.típica queda multiplicada
por el valor absoluto de dicha constante, y la
varianza por el cuadrado de dicha constante
94. Dados k grupos con n1, n2, ..., nk
observaciones con medias , ,...,
y con varianzas , ,....,
Se demuestra que la varianza del total de las
n1n2...nkn observaciones es igual a la media
ponderada de las varianzas parciales más la
varianza ponderada de las medias parciales.
Esta propiedad adquiere un sentido muy importante
en el segundo semestre en la técnica llamada
Análisis de Varianza (ANOVA). La idea es que la
varianza total se puede descomponer en un
componente intra-grupo (que es la primera parte
de la expresión de arriba) y un componente
entre-grupos (que es la segunda parte de la
expresión de arriba).
10Otras medidas de variabilidad
1. Amplitud total (AT)
Es la diferencia entre los valores extremos
Su ventaja es la sencillez de cálculo el
problema es que es únicamente sensible a los
valores extremos (e insensible a los intermedios).
2. Desviación media (DM)
El problema del empleo de la DM es la dificultad
que tiene trabajar con valores absolutos. La DM
es poco frecuente encontrarla en la práctica.
11Otras medidas de variabilidad
3. Amplitud semi-intercuartil (Q)
Está basada en el primer y tercer cuartil, lo que
la hace un estadístico resistente
Se emplea relativamente en alguna áreas de la
psicología se suele emplear cuando la mediana
sea el índice de tendencia central.
12Cómo ver la variabilidad en un gráfico
- Si bien es posible emplear diferentes gráficos
para evaluar la variabilidad (y tendencia
central, asimetría, etc), es interesante el uso
de los diagramas de caja y bigotes. - La caja viene definida por el primer cuartil y el
tercer cuartil, con la mediana también indicada.
Esto lo veremos en detalle en las prácticas. - Pero mejor veamos un ejemplo (Ratcliff, Perea,
Colangelo y Buchanan, en prensa, Brain
Cognition), en el que se examinan ciertas
características en una tarea de decisión léxica
(decidir si un estímulo era palabra o no se mide
el Tiempo de Reacción) con un grupo de controles
y un grupo de personas con daño cerebral
(afásicos). - Lo que se medía era
- un índice de cuán conservador eran las personas
en la tarea (boundary separation) - un índice correspondiente a procesos
no-decisionales (non-decision component). - un índice correspondiente a la calidad de
información (drift rate)
13Cómo ver la variabilidad en un gráfico (2)
La Mediana es el trazo grueso dentro de las cajas
(entre los cuartiles primero y tercero). Las
puntuaciones atípicas están presentadas
individualmente (ver que hay dos tipos de datos
atípicos). Observad que los controles son
claramente diferentes a los pacientes en
boundary separation y en el non-decision
component, mientras que hay bastante más
solapamiento en la calidad de información.
14Medidas robustas de variabilidad
1. La MEDA (Mediana de las diferencias absolutas
frente a la mediana)
Ejemplo de cálculo 3,4,4,5,5,6,7,8,9,11
(Md5.5) MEDA1.5 Es la Mediana de 05, 05,
05, 15, 15, 15, 25, 25, 35, 55
15Medidas robustas de variabilidad
2. La desviación pseudotípica
Es un índice de variabilidad que permite estimar
la desviación típica (que como sabemos es muy
susceptible a la influencia de puntuaciones
atípicas, como también ocurre con la media
aritmética) que cabría esperar de la muestra si
ésta perteneciera a una población en el que la
distribución subyacente sea la normal.