Introduccin a las Tcnicas de Muestreo - PowerPoint PPT Presentation

1 / 69
About This Presentation
Title:

Introduccin a las Tcnicas de Muestreo

Description:

... debe pertenecer a un estrato (y solo uno), y cada individuo del estrato habr de ... mediante el mismo se asume qu por ciento o proporci n de la muestra no puede ... – PowerPoint PPT presentation

Number of Views:349
Avg rating:3.0/5.0
Slides: 70
Provided by: bia60
Category:

less

Transcript and Presenter's Notes

Title: Introduccin a las Tcnicas de Muestreo


1
SAMPLING
2
Sampling Techniques
Samples
Probability Samples
Non-Probability Samples
Simple Random
Systematic
Judgement
Cluster
Convenience
Stratified
3
Concepto de Muestreo
  • El muestreo es una herramienta de la
    investigación científica.
  • Su función básica es determinar qué parte de una
    realidad en estudio (población o universo) debe
    examinarse con la finalidad de hacer inferencias
    sobre dicha población.

4
Error de Muestreo
  • El error que se comete debido al hecho de que se
    obtienen conclusiones sobre cierta realidad a
    partir de la observación de sólo una parte de
    ella, se denomina error de muestreo.
  • Obtener una muestra adecuada significa lograr una
    versión simplificada de la población, que
    reproduzca de algún modo sus rasgos básicos.

5
Muestra
  • En todas las ocasiones en que no es posible o
    conveniente realizar un censo, lo que se hace es
    trabajar con una muestra.
  • Entendiendo por tal, una parte representativa de
    la población.
  • Para que una muestra sea representativa, y por lo
    tanto útil, debe de reflejar las similitudes y
    diferencias encontradas en la población, debe
    ejemplificar las características de la misma.

6
Muestra Representativa
  • Cuando se dice que una muestra es representativa
    implica que reúne aproximadamente las
    características de la población que son
    importantes para la investigación.

7
Matemáticamente, se pueden describir muestras y
poblaciones con mediciones como la Media, La
Mediana, la Moda, la Desviación Estándar. Cuando
estos términos describen una muestra se denominan
estadísticas ó estadísticos. Un estadístico es
una característica de una muestra, se emplean
letras latinas minúsculas para denotar
estadísticos y muestras.
8
Terminología
  • Población objeto conjunto de individuos de los
    que se quiere obtener una información.
  • Unidades de muestreo número de elementos de la
    población, no solapados, que se van a estudiar.
    Todo miembro de la población pertenecerá a una y
    sólo una unidad de muestreo.

9
Terminología
  • Unidades de análisis objeto o individuo del que
    hay que obtener la información.
  • Marco muestral lista de unidades o elementos de
    muestreo.
  • Muestra conjunto de unidades o elementos de
    análisis sacados del marco muestral.

10
Tipos de Muestreo
  • Muestreo probabilístico. En este tipo de
    muestreo, la probabilidad de aparición en una
    muestra de cualquier elemento de la población es
    conocida (o calculable). Es el único
    científicamente válido.
  • Muestreo no probabilístico. Es aquel en el que la
    selección de los elementos de la muestra no se
    hacen al azar.

11
Muestreo probabilístico Este tipo de muestreo
garantiza que, a la larga, las muestras que se
van obteniendo de la población sean
representativas de la misma.
  • Muestreo aleatorio simple
  • Muestreo estratificado
  • Muestreo por conglomerados
  • Muestreo por etapas
  • Muestreo sistemático

12
Muestreo probabilístico 1. Muestreo aleatorio
simple Es aquel en el que, a priori, todos los
elementos de la muestra tienen la misma
probabilidad de aparición. Supongamos que
tengamos una población de 50.000 individuos, y
que tenemos un listado con sus nombres. Si
queremos elegir 100 personas, lo que necesitamos
es elegir al azar a 100 individuos de esos 50.000.
13
Muestreo probabilístico 2. Muestreo
estratificado En el muestreo estratificado, se
divide a los sujetos en diferentes
sub-poblaciones (o estratos), en función de
cierta característica relevante, y después se
hace es un muestro aleatorio simple de cada
estrato. Cada individuo debe pertenecer a un
estrato (y solo uno), y cada individuo del
estrato habrá de tener la misma probabilidad de
ser escogido como parte de la muestra.
14
Muestreo probabilístico 2. Muestreo
estratificado Ejemplo Supongamos que, en los
MBA de México, 70 de estudiantes van a escuela
pública y el 30 a privada. Si queremos 1,000
estudiantes para realizar cierto estudio, lo que
hacemos es dividir los alumnos en 2 estratos (U.
públicas y U. privadas) y se eligen
aleatoriamente 700 estudiantes de U. públicas y
300 de U. privadas
15
Muestreo probabilístico 3. Muestreo por
conglomerados En el muestreo por conglomerados,
en lugar de considerar cada elemento de la
población, lo que consideramos son conglomerados
de elementos. El proceso consiste en elegir
aleatoriamente uno o varios conglomerados y la
muestra estará formada por TODOS los elementos de
los conglomerados.
16
Muestreo probabilístico 3. Muestreo por
conglomerados Ejemplo Consideremos las
encuestas durante las elecciones, los
conglomerados pueden ser las mesas electorales,
el procedimiento de muestreo se realiza
escogiendo algunas mesas al azar. En el siguiente
paso, se consideran todos los votos de las mesas
seleccionadas). En otros ejemplos, los
conglomerados pueden ser los bloques de
viviendas, los municipios, etc.
17
Muestreo probabilístico 4. Muestreo por
etapas En este caso se combina el muestreo
aleatorio simple con el muestreo por
conglomerados Primero se realiza un muestreo
por conglomerados (por ejemplo, si los
conglomerados son las universidades mexicanas que
ofrecen programas de MBA, se seleccionan
aleatoriamente varias de ellas).
18
Muestreo probabilístico 4. Muestreo por
etapas Segundo, no se eligen todos los alumnos
(como ocurriría en un muestro por conglomerados),
sino que se elige una muestra aleatoria. (Dicha
muestra puede ser obtenida por muestreo aleatorio
simple o puede ser estratificado.) Se tienen así,
2 etapas de muestreo. Es posible tener más de 2
etapas.
19
Muestreo probabilístico 5. Muestreo aleatorio
sistemático Supongamos que tengamos una lista de
N elementos (por ejemplo, estudiantes de MBA) y
queramos una muestra de tamaño n. En este caso,
se ordenan (quizá en función de los apellidos) y
después se elige aleatoriamente un elemento entre
los N/nk primeros, y luego se elige de manera
sistemática el que esté k lugares después del
primer elemento seleccionado, y así sucesivamente.
20
  • Muestreo probabilístico
  • Muestreo aleatorio sistemático
  • Ejemplo
  • Tenemos 10000 estudiantes en una lista. Queremos
    obtener una muestra de 100 estudiantes.
  • Primero elegimos al azar un estudiante entre los
    10000/100100 primeros
  • Supongamos que salga el 26, el segundo elemento
    será el estudiante 10026 (126), el siguiente
    será el 226, luego el 326, etc.

21
  • Muestreo no probabilístico
  • Muestreo sin norma (o de conveniencia)
  • Se elige a una muestra por ser conveniente,
    fácil, económica. Pero no se hace en base a un
    criterio de aleatoriedad.
  • Ejemplo
  • Las encuestas en los medios electrónicos que el
    muestreo habitual en los trabajos en psicología.

22
Muestreo no probabilístico 2. Muestreo
intencional En este caso, si bien el muestreo no
es probabilístico, los investigadores procuran
que se garantice la representatividad de la
muestra.
23
Distribución muestral de un estadístico Supongamo
s que tenemos una variable aleatoria, cuya
distribución es f(x) Supongamos, por
simplicidad, que obtenemos una muestra aleatoria
simple con tamaño n X1, X2, ... Xn
24
Distribución muestral de un estadístico Entonces,
un estadístico es cualquier función h definida
sobre X1, X2, ... Xn y que no incluye parámetro
desconocido alguno Y h(X1, X2, ... Xn) La
distribución de dicho estadístico Y la
denominamos g(y)
25
Distribución muestral de un estadístico f(x) es
la distribución de la v.a. bajo estudio g(y) es
la distribución del estadístico que tenemos Es
necesario conocer la distribución muestral del
estadístico de interés para poder efectuar
inferencias sobre el parámetro correspondiente. E
sto es, para efectuar inferencias sobre la media
poblacional µ, necesitamos conocer la
distribución muestral de
26
Distribución muestral de la media Si la
distribución subyacente es normal, con media
y varianza La media de la distribución muestral
es La varianza de la distribución muestral es
La forma de la distribución muestral de la media
es normal.
Nota La desviación típica de la distribución
muestral suele ser denominada error típico de tal
estadístico.
27
Distribución muestral de la media. Ejemplo 1
Distribución poblacional subyacente (dist.
Normal) Media100 (Varianza225) Desv.
Estándar15
Distribución muestral de la media Tamaño
muestral10 Media100 (Varianza225/1022.5) Desv.
típica
En este y sucesivos gráficos Número de réplicas
28
Distribución muestral de la media. Ejemplo 2
Distribución poblacional subyacente (dist.
Normal) Media100 Desv. Estándar 15
Distribución muestral de la media Tamaño
muestral20 Media100 (Varianza225/2011.3) Desv.
típica3.35
29
Distribución muestral de la media. Ejemplo 3
Distribución poblacional subyacente (dist.
Normal) Media100 Desv. Estándar15
Distribución muestral de la media Tamaño
muestral50 Media100 (Varianza225/504.5) Desv.t
ípica2.12
30
La forma de la distribución muestral de la media
TAMBIÉN tiende a ser normal. En concreto, la
distribución muestral se acercará más y más a la
distribución normal (media µ y varianza s2/n) a
medida que se aumente el tamaño de cada muestra.
31
EJEMPLO
Samples
Probability Samples
Non-Probability Samples
Simple Random
Systematic
Judgement
Cluster
Convenience
Stratified
32
Necesidad de justificación de la Muestra
  • Si una muestra es representativa, entonces se
    pueden inferir conclusiones acerca de la
    población.
  • O describir características observadas en la
    muestra, que permita posteriormente hacer
    inferencias con relación a la población.
  • Es esencial que todo investigador demuestre que
    la muestra asumida es representativa de la
    población extraída

33
Preguntas de investigación en Muestreo
  • Cómo hacer para que una muestra sea
    representativa?
  • De qué forma se puede extraer la muestra de una
    población?
  • Cuántas personas u objetos tomar de una
    población para que sea lo más equitativa posible
    con relación a los distintos grupos o sectores
    que conforman la población?

34
EJEMPLO
  • La mayoría de las investigaciones en educación se
    trabaja con estratos, los cuales pueden ser
    escuelas de un estado, o de un municipio, grupos
    de una escuela o de diferentes escuelas. Se
    utiliza este tipo de muestreo para seleccionar
    una muestra de una población conformada por todas
    las universidades mexicanas que ofrecen programas
    de MBA, a efecto de aplicar instrumentos de
    diagnóstico para una investigación acerca de
    Cómo se desarrolla el trabajo metodológico en
    dichas escuelas?

35
Selección de la muestra estratificada a partir de
la población seleccionada
  • Para poder seleccionar la cantidad de
    instituciones a tomar como muestra del total de
    universidades mexicanas (7) , lo cual constituye
    la población
  • Emplearemos un estadístico, que permite
    determinar el tamaño de la muestra a partir de la
    población y teniendo en cuenta el número de
    estratos a trabajar (en este caso 7, que son las
    universidades).
  • Para ello plantearemos una metodología a seguir

36
Determinación de la cantidad de estratos de la
población del territorio
  • Relacionamos la cantidad de estratos que tiene la
    población, en este caso son las universidades
    mexicanas que ofrecen programas de MBA.

37
  • A cada estrato (universidad) se le hizo
    corresponder un número, comenzando en 1. Este
    número será constante para cada centro de ahora
    en adelante.

38
La cuestión es entonces determinar del total de
universidades, cuántos tomaremos como muestra
aleatoria simple, por lo que para ello se
aplicará el siguiente estadístico
39
Determinación de la muestra (1)
donde
Donde n0 Cantidad teórica de elementos de la
muestra. n Cantidad real de elementos de la
muestra a partir de la población asumida o de los
estratos asumidos en la población. N Número
total de elementos que conforman la población, o
número de estratos totales de la población.
40
Determinación de la muestra (2)
donde
Donde Z Valor estandarizado en función del
grado de confiabilidad de la muestra calculada.
Por ejemplo, si consideramos trabajar con un 95
de confiabilidad la muestra seleccionada,
entonces el valor estandarizado a asumir es igual
a 1.96 (Para dos colas, esto es .05/2.025 de
donde 1-.025.975, valor con el que se entra a
las tablas).
41
Determinación de la muestra (3)
donde
Donde Z Valor estandarizado en función del
grado de confiabilidad de la muestra calculada.
Algunos valores estandarizados (Z) en función del
grado de confiabilidad asumido (para dos
colas) Para un 99.0 ------------- z 2.58
(Empleado con frecuencia) 95.0
------------- z 1.96 (El más empleado)
90.0 ------------- z 1.64
42
Determinación de la muestra (4)
donde
Donde e Error asumido en el cálculo. Toda
expresión que se calcula contiene un error de
cálculo debido a las aproximaciones decimales que
surgen en la división por decimales, error en la
selección de la muestra. Este error se puede
asumir entre un 1 hasta un 10 o en valores de
probabilidad, entre 0.01 hasta 0.1 Se propone la
siguiente tabla para valores óptimos del error
para el cálculo del número de estratos de una
muestra
Para 3 N 10 ---------------- Se asume e
0.1 (un error del 10). Para N gt 10
--------------------- Se asume e 0.05 (un error
del 5).
43
Determinación de la muestra (5)
donde
Donde q probabilidad de la población que no
presenta las características. Este es un
parámetro muy importante, debido a que mediante
el mismo se asume qué por ciento o proporción de
la muestra no puede presentar las mismas
características de la población, debido a
diversos factores subjetivos y objetivos de los
individuos u objetos que conforman la población.
Muchos autores plantean esta probabilidad entre
un 1 hasta un 25, otros recomiendan, cuando no
se conoce esta variable asumir el valor máximo de
50.
44
Determinación de la muestra (6)
donde
De estudios realizados en investigación
educativa, se propone la siguiente tabla
  • Para 3 N 19 ------- Se asume q 0.01 (un
    1).
  • Para 20 N 29 ------ Se asume q 0.01 hasta
    0.02 (del 1 al 2).
  • Para 30 N 79 ----- Se asume q 0.02 hasta
    0.05 (del 2 al 5).
  • Para 80 N 159 ---- Se asume q 0.05 hasta
    0.10 (del 5 al 10).
  • Para N 160 --------- Se asume q 0.05 hasta
    0.20 (del 5 al 20).

45
Determinación de la muestra (7)
donde
Donde p Probabilidad de la población que
presenta las características. Dicho de una forma
más comprensible, es la probabilidad que tiene la
muestra en poseer las mismas cualidades de la
población (homogeneidad). Como p q 1
(Probabilidad máxima) ? p 1 q
46
Determinación del grado de confiabilidad y con
ello el valor de Z
donde
En el problema en cuestión se asumió un grado de
confiabilidad de un 95.0, por lo tanto z 1.96
47
Determinación del valor del error e asumido en el
cálculo
donde
Como el número de estratos (IES en el Edo. Mex.)
es igual a 7, entonces estamos trabajando con
valores de N menores de 11, por lo que se asume
un 10 (0.1), que es un valor recomendado para
muestras pequeñas o menores de 11. Entonces e
0.1
48
Determinación del valor de la probabilidad que
tiene la muestra de no poseer las mismas
cualidades de la población (q)
donde
Del análisis anterior, como el número de estratos
es igual a 7, entonces aplicando la tabla para
los valores de q, se asume un valor del 1,
luego q 0.01
49
Cálculo de la probabilidad que tiene la muestra
de poseer las mismas cualidades de la población
(p)
donde
Como ya se determinó el valor de q (probabilidad
de la proporción que no presenta las
características), se puede determinar p mediante
la expresión p 1 q, luego p 1 q p 1
0.01 0.99 p 0.99
50
Cálculo del tamaño de la muestra teórica (n0)
donde
n0 3,80
51
Cálculo del tamaño de la muestra real (n)
donde
n 2
52
  • De lo anterior se tiene que de un total de 7
    universidades que constituyen la cantidad total
    de estratos que tiene la población, considerando
    un 95.0 de nivel de confianza, asumiendo que el
    error de cálculo (e) sea de un 10 (0,01) y
    considerando que solamente el 1 de la muestra
    seleccionada no reúna las características de la
    población (q 0. 01), se determinó que la muestra
    representativa de dicha población puede ser dos
    estratos (universidades).

53
  • De lo anterior se infiere que la
    representatividad de una muestra está dada en
    considerar que la misma fue extraída de una
    población con un determinado nivel de confianza
    (se trabaja preferiblemente con un 95.0 de
    confianza o más), de asumir un determinado
    porcentaje en el error de cálculo, que debe estar
    comprendido entre 1 hasta 10 (0.01 hasta
    0.10) y de considerar un adecuado porcentaje
    (desde un 1 hasta un 20 ) en valores
    probabilísticos (0. 01 hasta 0. 2) de que la
    muestra no posee las características de la
    población. Esto se puede graficar de la siguiente
    forma

54
  • Para seleccionar los centros que compondrán la
    muestra se trabajó con la siguiente tabla

Se utilizó Introduction to the Practice of
Statistics, Moore McCabe, Freeman.
55
  • Ahora lo que queda es ver cómo se seleccionarán
    cada uno de los estratos que contiene cada
    centro, con relación a la cantidad de estudiantes
    a seleccionar por año y especialidades de ambos
    centros, de manera tal que dicha selección sea
    proporcional a cada uno de dichos estratos,
    veamos cómo proceder

56
Selección del tamaño de cada estrato de las
muestras seleccionas
  • En la tabla siguiente se han estratificado los
    estudiantes de cada centro (previamente
    seleccionados), distribuidos por años y
    especialidades, de manera que siguiendo la misma
    metodología anterior se pueda determinar la
    cantidad de estudiantes que tendrá la muestra a
    partir de la población constituida por la
    matrícula total de ambos centros (1993
    estudiantes).
  • Nótese el carácter relativo que tiene la
    población.

57
(No Transcript)
58
  • Es importante observar que en este paso interesa
    solamente la distribución por año y
    especialidades de ambos centros, así como la
    matrícula total que constituirá la población a
    seleccionar de ambas escuelas.
  • Ahora determinaremos la muestra a seleccionar de
    una población de 1993 estudiantes.

59
Determinación de la muestra
donde
Resulta evidente que hay que determinar los
valores de Z, e, q y p, para calcular el tamaño
de la muestra teórico y con este valor
determinar, en la fórmula el valor real de la
muestra a seleccionar de ambas escuelas.
60
Determinación del grado de Z
donde
Se sabe que el valor de Z, no es más que la
variable estandarizada para un grado de confianza
determinado, que en este caso se asume como 95
de confianza, lo que equivale a trabajar con la
probabilidad de 0.975, ya que trabajar con un
nivel de confianza del 95, significa que el
valor de alfa es igual a 0.05 (probabilidad de
que no se cumpla el nivel de confianza del
95). Pero como se trabaja con dos colas, debido
a que no conocemos si esta probabilidad es mayor
o menor, solamente que es igual o desigual,
entonces el valor de alfa (0,05) de divide entre
2 (2 colas) y este valor se le resta a la
probabilidad máxima de que ocurra un hecho (1) y
así se obtiene 1 0.025 0.975 y un valor de Z
1.96
61
Determinación del error de cálculo
donde
Se sabe que en todo tipo de cálculo con números
fraccionarios, siempre se tendrá que suprimir
determinada cantidad de cifras al aproximar los
cálculos efectuados, es por ello que siempre
induciremos un error de cálculo, además de otros
tipos de errores cometidos al seleccionar una
muestra, que puede ser sensible a la forma de
tomar los datos y hacer las mediciones. De aquí
que se debe prever el porcentaje del error que se
admitirá en el cálculo de la muestra. Para N gt
10 (ahora N1993), se debe asumir el error e
0.05 que es lo mismo que considerarlo en un 5.
Éste es el valor a tomar.
62
Determinación de la probabilidad q
donde
Se sabe que al realizar el cálculo de una muestra
se debe considerar un porcentaje o una proporción
de elementos que puedan incluirse en dicha
muestra, pero que no reúnan las características
de la población, a esta probabilidad se le ha
llamado q y se sugiere que para N 160, se
considera q 0.02 hasta un 0.2 (un error del 2
al 20 ). Para el ejemplo en cuestión se asume q
0.08 es decir, se consideró un 8
63
Determinación de la probabilidad p
donde
Como la probabilidad de considerar la proporción
de elementos que reúnen las mismas
características de la población se determina por
la expresión p 1- q, entonces al sustituir a q
en la misma tenemos p 1- 0.08 0.92
64
Cálculo de no
donde
65
Cálculo de n
donde
66
  • Ello indica que del total de la matrícula de 1993
    estudiantes, sería suficiente seleccionar 107 de
    ellos de forma aleatoria simple, considerando que
    se ha trabajado con un 95 del nivel de
    confianza, de cometer un 5 de error y de que en
    nuestra muestra un 8 no reúnan las
    características de la población por lo que se
    puede considerar a dicha muestra representativa
    en estos parámetros seleccionados.

67
Cálculo de la proporción de cada estrato
68
Conclusiones
  • Cuando se selecciona la muestra se debe tratar de
    que esta selección se haga por el método
    aleatorio simple o estratificado, si es que se
    quiere realizar inferencias con relación a la
    población investigada.
  • Este ejemplo muestra a los investigadores cómo
    seleccionar el tamaño de muestra (para las
    investigaciones en educación) para que sea
    significativa con relación a la población a
    trabajar.

69
Conclusiones
  • La significación está dada por tres aspectos muy
    importantes
  • el nivel de confianza, se prefiere hacerlo sobre
    95
  • el error a considerar en el cálculo, debe estar
    entre 1 y hasta un 5
  • y el porcentaje de probabilidad de que la muestra
    calculada no posee las características o
    propiedades de la población, este valor debe
    estar comprendido entre 1 y hasta un 20 (en
    valores de probabilidad), debiéndose asumir de
    .01 hasta .02 para poblaciones o estratos
    pequeños (menores de 29), de .02 hasta .05 para
    estratos o poblaciones medianas (entre 30 y 79) y
    entre .10 hasta .20 para poblaciones o estratos
    mayores de 80.
Write a Comment
User Comments (0)
About PowerShow.com