El problema: - PowerPoint PPT Presentation

1 / 21
About This Presentation
Title:

El problema:

Description:

Se seleccionaron cuatro docentes en escuelas primarias, intermedias y polimodal, ... independientes, con valor esperado nulo, y con el mismo grado de dispersi n para ... – PowerPoint PPT presentation

Number of Views:87
Avg rating:3.0/5.0
Slides: 22
Provided by: xx1136
Category:
Tags: nulo | problema

less

Transcript and Presenter's Notes

Title: El problema:


1
El problema
  • Un director departamental de escuelas desea
    estudiar el ausentismo de los docentes de
    diversos niveles escolares. Se seleccionaron
    cuatro docentes en escuelas primarias,
    intermedias y polimodal, y el número de días de
    ausencia el año pasado fue el siguiente

Con un nivel de significación de 0.05, hay
alguna diferencia en el ausentismo entre los
distintos niveles?
2
Introducción Como vemos en el ejemplo se hace
necesario definir un nuevo contraste de hipótesis
que sea aplicable en aquellas situaciones en las
que el número de medias que queremos comparar sea
superior a dos. Es por ello por lo que el
análisis de la varianza, ANOVA surge como una
generalización del contraste para dos medias de
la de Student, cuando el número de muestras a
contrastar es mayor que dos. En nuestro
ejemplo, supongamos las 3 muestras provienen de
tres poblaciones normales con la misma varianza
Y queremos realizar el contraste
3
Podríamos realizar los
contrastes siguientes con como nivel de
significación
de modo que se aceptaría H1 y se rechazaría H0
sólo si alguna de las hipótesis alternativas H1',
H1'' ó H1''' es aceptada y rechazada su
correspondiente hipótesis nula. El error de tipo
I para este contraste es
4
Por ejemplo, si tomamos un nivel de significación
a 0.05 para cada uno de los contrastes de
igualdad de dos medias, se obtendría que el nivel
de significación (error de tipo I) para el
contraste de las tres medias es de 1-0,125
0,875, lo que es una cantidad muy alta para lo
que acostumbramos a usar. En consecuencia, no es
adecuado realizar el contraste de igualdad de
medias de varias muestras mediante una multitud
de contrastes de igualdad de medias de dos
muestras. Una técnica que nos permite realizar
el contraste de modo conveniente es el
análisis de la varianza.
5
ANOVA con un factor Se denomina modelo factorial
con un factor o ANOVA con un factor al modelo
(lineal) en el que la variable analizada la
hacemos depender de un sólo factor de tal manera
que las causas de su variabilidad son englobadas
en una componente aleatoria que se denomina error
experimental Consideremos una variable sobre
la que actúa un factor que puede presentarse bajo
un determinado número de niveles, t. En nuestro
ejemplo podemos considerar el numero de
inasistencias que se da en t3 niveles
educativos
6
En este caso los factores que influyen en las
observaciones son tres el que el docente
pertenezca al nivel primario, intermedio o
polimodal. De modo general podemos representar
las t muestras (o niveles) del siguiente modo
donde por supuesto, los tamaños de cada muestra
ni, no tienen por que ser iguales. En este caso
decimos que se trata del modelo no equilibrado.
7
Supuestos del modelo
  • De ahora en adelante asumiremos que las
    siguientes condiciones son verificadas por las t
    muestras
  • Las observaciones proceden de poblaciones
    normales
  • Las t muestras son aleatorias e independientes.
    Además, dentro de cada nivel las observaciones
    son independientes entre sí.
  • En el modelo de un factor suponemos que las
    observaciones del nivel i, xij, provienen de una
    variable Xij de forma que todas tienen la misma
    varianza - hipótesis de homocedasticidad
  • o lo que es lo mismo,

8
De este modo es el valor esperado para las
observaciones del nivel i, y los errores
son variables aleatorias independientes, con
valor esperado nulo, y con el mismo grado de
dispersión para todas las observaciones. Otro
modo de escribir lo mismo consiste en introducir
una cantidad que sea el valor esperado
para una persona cualquiera de la población (sin
tener en cuenta los diferentes niveles), y
considerar los efectos introducidos por
los niveles, de modo que
9
  • Especificaciones del Modelo
  • Con todo lo anterior, el modelo ANOVA de un
    factor puede escribirse como
  • y con la siguiente interpretación
  • es una constante común a todos los
    niveles
  • es el efecto producido por el i-ésimo
    nivel. Al sumarlos todos deben compensarse los
    efectos negativos con los positivos para que la
    media común a todos los niveles sea realmente
    . Esto implica en particular que los efectos,
    , de los niveles no son independientes
  • es la parte de la variable Xij no
    explicada por ni , y que se distribuye
    del mismo modo (aunque independientemente) para
    cada observación, según la ley gaussiana
  • Ésta es la condición de homocedasticidad, y es
    fundamental en el análisis de la varianza.

10
  • Obsérvese que ahora podemos escribir el contraste
    de que los diferentes niveles no tienen
    influencia sobre la observación de la variable
    como
  • Observación
  • Se utiliza el nombre de análisis de la varianza
    ya que el elemento básico del análisis
    estadístico será precisamente el estudio de la
    variabilidad. Teóricamente es posible dividir la
    variabilidad de la variable que se estudia en dos
    partes
  • La originada por el factor en cuestión
  • La producida por los restantes factores que
    entran en juego, conocidos o no, controlables o
    no, que se conocen con el nombre de error
    experimental.
  • Si mediante los contrastes estadísticos adecuados
    la variación producida por cierto factor es
    significativamente mayor que la producida por el
    error experimental podemos aceptar la hipótesis
    de que los distintos niveles del factor actúan de
    forma distinta.

11
Algo de notación relativa al modelo Esta parte
está dedicada a introducir alguna notación para
escribir los términos que serán más importantes a
la hora de realizar un contraste por el método
ANOVA. En primer lugar tenemos Usando
estos términos vamos a desglosar la variación
total de la muestra en variación total dentro de
cada nivel (intravariación) más la variación
entre los distintos niveles (intervariación).
12
Para ello utilizamos la proposición
donde
Observación En el cálculo del estadístico
intervienen N cantidades, ligadas por una
relación de este modo el número de grados de
libertad de este estadístico es N-1. Por razones
análogas tenemos que el número de grados de
libertad de es N-t y el de
es t-1.
13
Así introducimos los siguientes estadísticos
Estos son los estadísticos que realmente nos
interesan a la hora de realizar el contraste de
igualdad de medias. Cuando la diferencia entre
los efectos de los diferentes niveles sea muy
baja, es de esperar que la cuasivarianza total
sea próxima a la intravarianza, o lo que es lo
mismo, que la intervarianza sea pequeña en
relación con la intravarianza.
14
  • En la figura de superior no existe una evidencia
    significativa en contra de que las medias de los
    tres grupos de observaciones coinciden.
  • En la figura inferior sí.

15
Forma de efectuar el contraste Consideramos el
contraste y suponemos que estamos en las
condiciones del modelo factorial de un factor. Si
Ho es cierta se puede demostrar que el siguiente
estadístico se distribuye como una de Snedecor
Luego si al calcular Fexp obtenemos que
donde es un nivel de
significación dado, deberemos de rechazar la
hipótesis nula (ya que si Ho fuese cierta, era de
esperar que fuese pequeño en
relación con ).
16
Método reducido para el análisis de un factor En
primer lugar calculamos los siguientes
estadísticos a partir de la tabla de las
observaciones en cada nivel
17
Entonces las siguientes cantidades admiten una
expresión muy sencilla Calculamos y dado el
nivel de significación a buscamos en una tabla
de la distribución F de Snedecor el valor
rechazando H0 si FexpgtFteo.
Se acepta la igualdad de medias
Se rechaza que todas las medias sean iguales
Fteo
18
VOLVEMOS AL EJEMPLO INICIAL
19
Al analizar los datos obtenidos, la variación
observada entre las cantidades de inasistencias
promedio de los distintos niveles de enseñanza
las podemos atribuir a
  • Variación en las cantidades de inasistencias
    entre los docentes del mismo nivel
    Variación dentro de las muestras
  • Variación en las cantidades de inasistencias de
    los docentes de distintos niveles
    Variación entre las muestras

20
Recordemos que debemos calcular entonces lo
siguiente
Que cuando hacemos las cuentas resulta
Con estos datos debemos calcular
21
Calculamos el valor del estadístico
experimental
y dado el nivel de significación a 0.05
buscamos en una tabla de la distribución F de
Snedecor el valor
Como Fexp lt Fteo NO rechazo
Ho. Entonces las diferencias entre las cantidades
promedio de inasistencias en los distintos
niveles no son significativas.
a 0.05
3.6996
4.2565
Write a Comment
User Comments (0)
About PowerShow.com