Title: Introduccin a las Tcnicas de Muestreo
1SAMPLING
2Sampling Techniques
Samples
Probability Samples
Non-Probability Samples
Simple Random
Systematic
Judgement
Cluster
Convenience
Stratified
3Concepto de Muestreo
- El muestreo es una herramienta de la
investigación científica. - Su función básica es determinar qué parte de una
realidad en estudio (población o universo) debe
examinarse con la finalidad de hacer inferencias
sobre dicha población.
4Error de Muestreo
- El error que se comete debido al hecho de que se
obtienen conclusiones sobre cierta realidad a
partir de la observación de sólo una parte de
ella, se denomina error de muestreo. - Obtener una muestra adecuada significa lograr una
versión simplificada de la población, que
reproduzca de algún modo sus rasgos básicos.
5Muestra
- En todas las ocasiones en que no es posible o
conveniente realizar un censo, lo que se hace es
trabajar con una muestra. - Entendiendo por tal, una parte representativa de
la población. - Para que una muestra sea representativa, y por lo
tanto útil, debe de reflejar las similitudes y
diferencias encontradas en la población, debe
ejemplificar las características de la misma.
6Muestra Representativa
- Cuando se dice que una muestra es representativa
implica que reúne aproximadamente las
características de la población que son
importantes para la investigación.
7Matemáticamente, se pueden describir muestras y
poblaciones con mediciones como la Media, La
Mediana, la Moda, la Desviación Estándar. Cuando
estos términos describen una muestra se denominan
estadísticas ó estadísticos. Un estadístico es
una característica de una muestra, se emplean
letras latinas minúsculas para denotar
estadísticos y muestras.
8Terminología
- Población objeto conjunto de individuos de los
que se quiere obtener una información. - Unidades de muestreo número de elementos de la
población, no solapados, que se van a estudiar.
Todo miembro de la población pertenecerá a una y
sólo una unidad de muestreo.
9Terminología
- Unidades de análisis objeto o individuo del que
hay que obtener la información. - Marco muestral lista de unidades o elementos de
muestreo. - Muestra conjunto de unidades o elementos de
análisis sacados del marco muestral.
10Tipos de Muestreo
- Muestreo probabilístico. En este tipo de
muestreo, la probabilidad de aparición en una
muestra de cualquier elemento de la población es
conocida (o calculable). Es el único
científicamente válido. - Muestreo no probabilístico. Es aquel en el que la
selección de los elementos de la muestra no se
hacen al azar.
11Muestreo probabilístico Este tipo de muestreo
garantiza que, a la larga, las muestras que se
van obteniendo de la población sean
representativas de la misma.
- Muestreo aleatorio simple
- Muestreo estratificado
- Muestreo por conglomerados
- Muestreo por etapas
- Muestreo sistemático
12Muestreo probabilístico 1. Muestreo aleatorio
simple Es aquel en el que, a priori, todos los
elementos de la muestra tienen la misma
probabilidad de aparición. Supongamos que
tengamos una población de 50.000 individuos, y
que tenemos un listado con sus nombres. Si
queremos elegir 100 personas, lo que necesitamos
es elegir al azar a 100 individuos de esos 50.000.
13Muestreo probabilístico 2. Muestreo
estratificado En el muestreo estratificado, se
divide a los sujetos en diferentes
sub-poblaciones (o estratos), en función de
cierta característica relevante, y después se
hace es un muestro aleatorio simple de cada
estrato. Cada individuo debe pertenecer a un
estrato (y solo uno), y cada individuo del
estrato habrá de tener la misma probabilidad de
ser escogido como parte de la muestra.
14Muestreo probabilístico 2. Muestreo
estratificado Ejemplo Supongamos que, en los
MBA de México, 70 de estudiantes van a escuela
pública y el 30 a privada. Si queremos 1,000
estudiantes para realizar cierto estudio, lo que
hacemos es dividir los alumnos en 2 estratos (U.
públicas y U. privadas) y se eligen
aleatoriamente 700 estudiantes de U. públicas y
300 de U. privadas
15Muestreo probabilístico 3. Muestreo por
conglomerados En el muestreo por conglomerados,
en lugar de considerar cada elemento de la
población, lo que consideramos son conglomerados
de elementos. El proceso consiste en elegir
aleatoriamente uno o varios conglomerados y la
muestra estará formada por TODOS los elementos de
los conglomerados.
16Muestreo probabilístico 3. Muestreo por
conglomerados Ejemplo Consideremos las
encuestas durante las elecciones, los
conglomerados pueden ser las mesas electorales,
el procedimiento de muestreo se realiza
escogiendo algunas mesas al azar. En el siguiente
paso, se consideran todos los votos de las mesas
seleccionadas). En otros ejemplos, los
conglomerados pueden ser los bloques de
viviendas, los municipios, etc.
17Muestreo probabilístico 4. Muestreo por
etapas En este caso se combina el muestreo
aleatorio simple con el muestreo por
conglomerados Primero se realiza un muestreo
por conglomerados (por ejemplo, si los
conglomerados son las universidades mexicanas que
ofrecen programas de MBA, se seleccionan
aleatoriamente varias de ellas).
18Muestreo probabilístico 4. Muestreo por
etapas Segundo, no se eligen todos los alumnos
(como ocurriría en un muestro por conglomerados),
sino que se elige una muestra aleatoria. (Dicha
muestra puede ser obtenida por muestreo aleatorio
simple o puede ser estratificado.) Se tienen así,
2 etapas de muestreo. Es posible tener más de 2
etapas.
19Muestreo probabilístico 5. Muestreo aleatorio
sistemático Supongamos que tengamos una lista de
N elementos (por ejemplo, estudiantes de MBA) y
queramos una muestra de tamaño n. En este caso,
se ordenan (quizá en función de los apellidos) y
después se elige aleatoriamente un elemento entre
los N/nk primeros, y luego se elige de manera
sistemática el que esté k lugares después del
primer elemento seleccionado, y así sucesivamente.
20- Muestreo probabilístico
- Muestreo aleatorio sistemático
- Ejemplo
- Tenemos 10000 estudiantes en una lista. Queremos
obtener una muestra de 100 estudiantes. - Primero elegimos al azar un estudiante entre los
10000/100100 primeros - Supongamos que salga el 26, el segundo elemento
será el estudiante 10026 (126), el siguiente
será el 226, luego el 326, etc.
21- Muestreo no probabilístico
- Muestreo sin norma (o de conveniencia)
- Se elige a una muestra por ser conveniente,
fácil, económica. Pero no se hace en base a un
criterio de aleatoriedad. - Ejemplo
- Las encuestas en los medios electrónicos que el
muestreo habitual en los trabajos en psicología.
22Muestreo no probabilístico 2. Muestreo
intencional En este caso, si bien el muestreo no
es probabilístico, los investigadores procuran
que se garantice la representatividad de la
muestra.
23Distribución muestral de un estadístico Supongamo
s que tenemos una variable aleatoria, cuya
distribución es f(x) Supongamos, por
simplicidad, que obtenemos una muestra aleatoria
simple con tamaño n X1, X2, ... Xn
24Distribución muestral de un estadístico Entonces,
un estadístico es cualquier función h definida
sobre X1, X2, ... Xn y que no incluye parámetro
desconocido alguno Y h(X1, X2, ... Xn) La
distribución de dicho estadístico Y la
denominamos g(y)
25Distribución muestral de un estadístico f(x) es
la distribución de la v.a. bajo estudio g(y) es
la distribución del estadístico que tenemos Es
necesario conocer la distribución muestral del
estadístico de interés para poder efectuar
inferencias sobre el parámetro correspondiente. E
sto es, para efectuar inferencias sobre la media
poblacional µ, necesitamos conocer la
distribución muestral de
26Distribución muestral de la media Si la
distribución subyacente es normal, con media
y varianza La media de la distribución muestral
es La varianza de la distribución muestral es
La forma de la distribución muestral de la media
es normal.
Nota La desviación típica de la distribución
muestral suele ser denominada error típico de tal
estadístico.
27Distribución muestral de la media. Ejemplo 1
Distribución poblacional subyacente (dist.
Normal) Media100 (Varianza225) Desv.
Estándar15
Distribución muestral de la media Tamaño
muestral10 Media100 (Varianza225/1022.5) Desv.
típica
En este y sucesivos gráficos Número de réplicas
28Distribución muestral de la media. Ejemplo 2
Distribución poblacional subyacente (dist.
Normal) Media100 Desv. Estándar 15
Distribución muestral de la media Tamaño
muestral20 Media100 (Varianza225/2011.3) Desv.
típica3.35
29Distribución muestral de la media. Ejemplo 3
Distribución poblacional subyacente (dist.
Normal) Media100 Desv. Estándar15
Distribución muestral de la media Tamaño
muestral50 Media100 (Varianza225/504.5) Desv.t
ípica2.12
30La forma de la distribución muestral de la media
TAMBIÉN tiende a ser normal. En concreto, la
distribución muestral se acercará más y más a la
distribución normal (media µ y varianza s2/n) a
medida que se aumente el tamaño de cada muestra.
31EJEMPLO
Samples
Probability Samples
Non-Probability Samples
Simple Random
Systematic
Judgement
Cluster
Convenience
Stratified
32Necesidad de justificación de la Muestra
- Si una muestra es representativa, entonces se
pueden inferir conclusiones acerca de la
población. - O describir características observadas en la
muestra, que permita posteriormente hacer
inferencias con relación a la población. - Es esencial que todo investigador demuestre que
la muestra asumida es representativa de la
población extraída
33Preguntas de investigación en Muestreo
- Cómo hacer para que una muestra sea
representativa? - De qué forma se puede extraer la muestra de una
población? - Cuántas personas u objetos tomar de una
población para que sea lo más equitativa posible
con relación a los distintos grupos o sectores
que conforman la población?
34EJEMPLO
- La mayoría de las investigaciones en educación se
trabaja con estratos, los cuales pueden ser
escuelas de un estado, o de un municipio, grupos
de una escuela o de diferentes escuelas. Se
utiliza este tipo de muestreo para seleccionar
una muestra de una población conformada por todas
las universidades mexicanas que ofrecen programas
de MBA, a efecto de aplicar instrumentos de
diagnóstico para una investigación acerca de
Cómo se desarrolla el trabajo metodológico en
dichas escuelas?
35Selección de la muestra estratificada a partir de
la población seleccionada
- Para poder seleccionar la cantidad de
instituciones a tomar como muestra del total de
universidades mexicanas (7) , lo cual constituye
la población - Emplearemos un estadístico, que permite
determinar el tamaño de la muestra a partir de la
población y teniendo en cuenta el número de
estratos a trabajar (en este caso 7, que son las
universidades). - Para ello plantearemos una metodología a seguir
36 Determinación de la cantidad de estratos de la
población del territorio
- Relacionamos la cantidad de estratos que tiene la
población, en este caso son las universidades
mexicanas que ofrecen programas de MBA.
37- A cada estrato (universidad) se le hizo
corresponder un número, comenzando en 1. Este
número será constante para cada centro de ahora
en adelante.
38La cuestión es entonces determinar del total de
universidades, cuántos tomaremos como muestra
aleatoria simple, por lo que para ello se
aplicará el siguiente estadístico
39Determinación de la muestra (1)
donde
Donde n0 Cantidad teórica de elementos de la
muestra. n Cantidad real de elementos de la
muestra a partir de la población asumida o de los
estratos asumidos en la población. N Número
total de elementos que conforman la población, o
número de estratos totales de la población.
40Determinación de la muestra (2)
donde
Donde Z Valor estandarizado en función del
grado de confiabilidad de la muestra calculada.
Por ejemplo, si consideramos trabajar con un 95
de confiabilidad la muestra seleccionada,
entonces el valor estandarizado a asumir es igual
a 1.96 (Para dos colas, esto es .05/2.025 de
donde 1-.025.975, valor con el que se entra a
las tablas).
41Determinación de la muestra (3)
donde
Donde Z Valor estandarizado en función del
grado de confiabilidad de la muestra calculada.
Algunos valores estandarizados (Z) en función del
grado de confiabilidad asumido (para dos
colas) Para un 99.0 ------------- z 2.58
(Empleado con frecuencia) 95.0
------------- z 1.96 (El más empleado)
90.0 ------------- z 1.64
42Determinación de la muestra (4)
donde
Donde e Error asumido en el cálculo. Toda
expresión que se calcula contiene un error de
cálculo debido a las aproximaciones decimales que
surgen en la división por decimales, error en la
selección de la muestra. Este error se puede
asumir entre un 1 hasta un 10 o en valores de
probabilidad, entre 0.01 hasta 0.1 Se propone la
siguiente tabla para valores óptimos del error
para el cálculo del número de estratos de una
muestra
Para 3 N 10 ---------------- Se asume e
0.1 (un error del 10). Para N gt 10
--------------------- Se asume e 0.05 (un error
del 5).
43Determinación de la muestra (5)
donde
Donde q probabilidad de la población que no
presenta las características. Este es un
parámetro muy importante, debido a que mediante
el mismo se asume qué por ciento o proporción de
la muestra no puede presentar las mismas
características de la población, debido a
diversos factores subjetivos y objetivos de los
individuos u objetos que conforman la población.
Muchos autores plantean esta probabilidad entre
un 1 hasta un 25, otros recomiendan, cuando no
se conoce esta variable asumir el valor máximo de
50.
44Determinación de la muestra (6)
donde
De estudios realizados en investigación
educativa, se propone la siguiente tabla
- Para 3 N 19 ------- Se asume q 0.01 (un
1). - Para 20 N 29 ------ Se asume q 0.01 hasta
0.02 (del 1 al 2). - Para 30 N 79 ----- Se asume q 0.02 hasta
0.05 (del 2 al 5). - Para 80 N 159 ---- Se asume q 0.05 hasta
0.10 (del 5 al 10). - Para N 160 --------- Se asume q 0.05 hasta
0.20 (del 5 al 20).
45Determinación de la muestra (7)
donde
Donde p Probabilidad de la población que
presenta las características. Dicho de una forma
más comprensible, es la probabilidad que tiene la
muestra en poseer las mismas cualidades de la
población (homogeneidad). Como p q 1
(Probabilidad máxima) ? p 1 q
46Determinación del grado de confiabilidad y con
ello el valor de Z
donde
En el problema en cuestión se asumió un grado de
confiabilidad de un 95.0, por lo tanto z 1.96
47Determinación del valor del error e asumido en el
cálculo
donde
Como el número de estratos (IES en el Edo. Mex.)
es igual a 7, entonces estamos trabajando con
valores de N menores de 11, por lo que se asume
un 10 (0.1), que es un valor recomendado para
muestras pequeñas o menores de 11. Entonces e
0.1
48Determinación del valor de la probabilidad que
tiene la muestra de no poseer las mismas
cualidades de la población (q)
donde
Del análisis anterior, como el número de estratos
es igual a 7, entonces aplicando la tabla para
los valores de q, se asume un valor del 1,
luego q 0.01
49Cálculo de la probabilidad que tiene la muestra
de poseer las mismas cualidades de la población
(p)
donde
Como ya se determinó el valor de q (probabilidad
de la proporción que no presenta las
características), se puede determinar p mediante
la expresión p 1 q, luego p 1 q p 1
0.01 0.99 p 0.99
50Cálculo del tamaño de la muestra teórica (n0)
donde
n0 3,80
51 Cálculo del tamaño de la muestra real (n)
donde
n 2
52- De lo anterior se tiene que de un total de 7
universidades que constituyen la cantidad total
de estratos que tiene la población, considerando
un 95.0 de nivel de confianza, asumiendo que el
error de cálculo (e) sea de un 10 (0,01) y
considerando que solamente el 1 de la muestra
seleccionada no reúna las características de la
población (q 0. 01), se determinó que la muestra
representativa de dicha población puede ser dos
estratos (universidades).
53- De lo anterior se infiere que la
representatividad de una muestra está dada en
considerar que la misma fue extraída de una
población con un determinado nivel de confianza
(se trabaja preferiblemente con un 95.0 de
confianza o más), de asumir un determinado
porcentaje en el error de cálculo, que debe estar
comprendido entre 1 hasta 10 (0.01 hasta
0.10) y de considerar un adecuado porcentaje
(desde un 1 hasta un 20 ) en valores
probabilísticos (0. 01 hasta 0. 2) de que la
muestra no posee las características de la
población. Esto se puede graficar de la siguiente
forma
54- Para seleccionar los centros que compondrán la
muestra se trabajó con la siguiente tabla
Se utilizó Introduction to the Practice of
Statistics, Moore McCabe, Freeman.
55- Ahora lo que queda es ver cómo se seleccionarán
cada uno de los estratos que contiene cada
centro, con relación a la cantidad de estudiantes
a seleccionar por año y especialidades de ambos
centros, de manera tal que dicha selección sea
proporcional a cada uno de dichos estratos,
veamos cómo proceder
56Selección del tamaño de cada estrato de las
muestras seleccionas
- En la tabla siguiente se han estratificado los
estudiantes de cada centro (previamente
seleccionados), distribuidos por años y
especialidades, de manera que siguiendo la misma
metodología anterior se pueda determinar la
cantidad de estudiantes que tendrá la muestra a
partir de la población constituida por la
matrícula total de ambos centros (1993
estudiantes). - Nótese el carácter relativo que tiene la
población.
57(No Transcript)
58- Es importante observar que en este paso interesa
solamente la distribución por año y
especialidades de ambos centros, así como la
matrícula total que constituirá la población a
seleccionar de ambas escuelas. - Ahora determinaremos la muestra a seleccionar de
una población de 1993 estudiantes.
59Determinación de la muestra
donde
Resulta evidente que hay que determinar los
valores de Z, e, q y p, para calcular el tamaño
de la muestra teórico y con este valor
determinar, en la fórmula el valor real de la
muestra a seleccionar de ambas escuelas.
60Determinación del grado de Z
donde
Se sabe que el valor de Z, no es más que la
variable estandarizada para un grado de confianza
determinado, que en este caso se asume como 95
de confianza, lo que equivale a trabajar con la
probabilidad de 0.975, ya que trabajar con un
nivel de confianza del 95, significa que el
valor de alfa es igual a 0.05 (probabilidad de
que no se cumpla el nivel de confianza del
95). Pero como se trabaja con dos colas, debido
a que no conocemos si esta probabilidad es mayor
o menor, solamente que es igual o desigual,
entonces el valor de alfa (0,05) de divide entre
2 (2 colas) y este valor se le resta a la
probabilidad máxima de que ocurra un hecho (1) y
así se obtiene 1 0.025 0.975 y un valor de Z
1.96
61Determinación del error de cálculo
donde
Se sabe que en todo tipo de cálculo con números
fraccionarios, siempre se tendrá que suprimir
determinada cantidad de cifras al aproximar los
cálculos efectuados, es por ello que siempre
induciremos un error de cálculo, además de otros
tipos de errores cometidos al seleccionar una
muestra, que puede ser sensible a la forma de
tomar los datos y hacer las mediciones. De aquí
que se debe prever el porcentaje del error que se
admitirá en el cálculo de la muestra. Para N gt
10 (ahora N1993), se debe asumir el error e
0.05 que es lo mismo que considerarlo en un 5.
Éste es el valor a tomar.
62Determinación de la probabilidad q
donde
Se sabe que al realizar el cálculo de una muestra
se debe considerar un porcentaje o una proporción
de elementos que puedan incluirse en dicha
muestra, pero que no reúnan las características
de la población, a esta probabilidad se le ha
llamado q y se sugiere que para N 160, se
considera q 0.02 hasta un 0.2 (un error del 2
al 20 ). Para el ejemplo en cuestión se asume q
0.08 es decir, se consideró un 8
63Determinación de la probabilidad p
donde
Como la probabilidad de considerar la proporción
de elementos que reúnen las mismas
características de la población se determina por
la expresión p 1- q, entonces al sustituir a q
en la misma tenemos p 1- 0.08 0.92
64Cálculo de no
donde
65Cálculo de n
donde
66- Ello indica que del total de la matrícula de 1993
estudiantes, sería suficiente seleccionar 107 de
ellos de forma aleatoria simple, considerando que
se ha trabajado con un 95 del nivel de
confianza, de cometer un 5 de error y de que en
nuestra muestra un 8 no reúnan las
características de la población por lo que se
puede considerar a dicha muestra representativa
en estos parámetros seleccionados.
67Cálculo de la proporción de cada estrato
68Conclusiones
- Cuando se selecciona la muestra se debe tratar de
que esta selección se haga por el método
aleatorio simple o estratificado, si es que se
quiere realizar inferencias con relación a la
población investigada. - Este ejemplo muestra a los investigadores cómo
seleccionar el tamaño de muestra (para las
investigaciones en educación) para que sea
significativa con relación a la población a
trabajar.
69Conclusiones
- La significación está dada por tres aspectos muy
importantes - el nivel de confianza, se prefiere hacerlo sobre
95 - el error a considerar en el cálculo, debe estar
entre 1 y hasta un 5 - y el porcentaje de probabilidad de que la muestra
calculada no posee las características o
propiedades de la población, este valor debe
estar comprendido entre 1 y hasta un 20 (en
valores de probabilidad), debiéndose asumir de
.01 hasta .02 para poblaciones o estratos
pequeños (menores de 29), de .02 hasta .05 para
estratos o poblaciones medianas (entre 30 y 79) y
entre .10 hasta .20 para poblaciones o estratos
mayores de 80.