Muestras aleatorias. Distribuciones en el muestreo. Introducción Noción y tipos de muestras Estadísticos o Estimadores Principales Distrib.

Download Report

Transcript Muestras aleatorias. Distribuciones en el muestreo. Introducción Noción y tipos de muestras Estadísticos o Estimadores Principales Distrib.

Muestras aleatorias.
Distribuciones en el muestreo.
Introducción
Noción y tipos de muestras
Estadísticos o Estimadores
Principales Distrib. en el muestreo
Teorema Central del Límite
Ejercicios
Introducción
Los análisis estadísticos que se realizan en el mundo real tienen como
objetivo estudiar las propiedades características de las poblaciones (cuyos
individuos pueden ser personas, animales o cosas).
Pero estudiar todos los individuos de la población supone:
• Elevados costes económicos
• Mucho tiempo de trabajo
• Errores de medición
• En algunos casos, la destrucción del elemento objeto del estudio (vida
media de un motor, tiempo de duración de determinado tipo de
cubiertas de automóvil,…)
Se recurre entonces a considerar conjuntos de elementos representativos de
dicha población, llamadas muestras, cuyas propiedades nos permiten
inducir las propiedades que nos interesan de la población.
El estudio de poblaciones mediante muestras adecuadas tomadas de ellas
constituye la llamada Inferencia Estadística, Estadística Inductiva, Teoría de
la Estimación o Teoría de Muestras
Introducción
Para inferir resultados de las poblaciones a partir de datos de las
muestras cabe distinguir dos formas generales de actuar:
Estimación: Entenderemos por estimación de un parámetro poblacional
al cálculo del valor de este a través de una muestra. Por ejemplo, si
pretendemos determinar el valor de la media poblacional, podríamos
calcular la media de la muestra elegida y atribuir este valor a aquella.
Para que esta estimación sea correcta debe cumplir ciertas condiciones.
Prueba o contraste de hipótesis: En este caso se realiza una conjetura
(hipótesis) sobre el valor del parámetro poblacional desconocido,
basándonos en informaciones o conocimiento previo del problema y se
trata de elaborar una regla que nos permita dilucidar sobre su validez.
Esta regla se denomina contraste o test de la hipótesis.
Ambas formas de
complementarias.
actuar para
producir una
inferencia
son
Noción y tipos de muestras
Un punto clave en el proceso de inferencia es la elección de la muestra, pues
los resultados de la inferencia serán tanto mejores cuanto más representativa
sea esta de la población de partida. Existen varias formas de seleccionar
muestras de las poblaciones:
Muestra aleatoria: cuando los elementos de la población se eligen de forma
aleatoria, usando cualquier mecanismo de azar
aleatoria simple (m.a.s.): Se garantiza que todos los individuos de la
población tengan la misma probabilidad de ser elegidos en la muestra y que
los miembros de esta se elijan de forma independiente.
sistemática: se obtiene eligiendo al azar, mediante m. a. s., un elemento de los
k primeros (xi). El resto de los elementos muestrales vendrán dados por xi+k,
xi +2k,…. Siendo k el entero más próximo a N/n, donde N es el tamaño de la
población y n el de la muestra.
estratificada: se dividen los elementos de la población en clases o estratos
(edad, renta, etc…) y dentro de cada uno de ellos se eligen los elementos por
m. a. s. o sistemático.
Muestra no aleatoria: Se seleccionan los individuos de forma subjetiva
(opinática), lo que puede introducir cierto sesgo a los resultados obtenidos.
Noción y tipos de muestras
Nosotros supondremos a partir de ahora que utilizamos siempre el muestreo
aleatorio simple:
Para seleccionar una muestra aleatoria simple de tamaño n de una población
que sigue una distribución f(x), se utilizará cualquier mecanismo de azar
(lanzar una moneda, sacar bolas numeradas, …) n veces, de forma
independiente y se define una variable aleatoria Xi: i=1,2,...,n, que representa
la medición o valor muestral iésimo que se observe. Las variables aleatorias
X1, X2, ..., Xn (o la variable aleatoria multidimensional (X1,X2,...Xn)),
constituirán entonces una muestra aleatoria simple de la población f(x) con
valores numéricos x1, x2, ..., xn
Debido a las condiciones idénticas bajo las cuales se seleccionan los
elementos de la muestra, es razonable suponer que las n variables aleatorias
X1, X2, ..., Xn son independientes, y que cada una tiene la misma distribución
de probabilidad f(x). Esto es, las distribuciones de probabilidad de X1, X2, ...,
Xn son, respectivamente, f(x1), f(x2), ..., f(xn) y su distribución de
probabilidad conjunta es: f(X1,X2, ... Xn) = f(X1).f(X2)....f(Xn) .
Estadísticos o Estimadores
Un parámetro es una caracterización numérica de la distribución de la
población (esperanza, varianza,…). Es un valor fijo y desconocido,
puesto que para conocerlo necesitaríamos estudiar toda la población.
Como los parámetros poblacionales son difíciles de obtener
directamente, se recurre a los estadísticos o estadigrafos para
estimarlos. Un estadístico no es más que una función de las variables
aleatorias que constituyen la muestra y que no contiene ningún valor
desconocido. Es una caracterización numérica de la muestra (media,
varianza, …). Su valor no es fijo, sino que depende de la muestra
particular seleccionada.
Dada una m.a.s. X1, X2, ..., Xn, de una población en la que se estudia la
variable aleatoria X, se define Y = H(X1, X2, ..., Xn), donde H es cualquier
función real, como un estadístico o estadigrafo, que, para cada
realización de la muestra, definida por el n-tuplo (x1, x2, ... xn) toma un
valor diferente y = H(x1, x2, ..., xn).
Estadísticos o Estimadores
De acuerdo con esta definición un estadigrafo es una variable aleatoria
que, como tal, tiene una distribución de probabilidad (con su media, su
varianza, etc…), que se conoce como distribución en el muestreo o
distribución muestral. Así, si el estadístico es la media muestral, podremos
hablar de la distribución en el muestreo de la media muestral, y de la
media o esperanza de la distribución en el muestreo de la media muestral.
La distribución muestral de un estadístico depende del tamaño de la
población, del tamaño de las muestras y del método de selección de estas
últimas.
En el resto de este tema se estudiarán varias de las distribuciones
muestrales de uso más frecuente en Estadística. Las aplicaciones de estas
distribuciones muestrales a problemas de inferencia estadística se verán en
los temas siguientes.
Estadísticos o Estimadores
Ejemplo:
Tenemos una población con los siguientes N = 3 elementos: X = {1, 2 y 3}.
Donde  =2 2 = 0,67.
Se extraen muestras de n = 2 elementos:
Con reposición, tenemos 9 posibles muestras:
(1, 1); (1, 2); (1, 3); (2, 1); (2, 2); (2, 3); (3, 1); (3, 2); y (3, 3).
Sin reposición, tenemos 6 posibles muestras:
(1, 2); (1, 3); (2, 1); (2, 3); (3, 1); y (3, 2).
En cada una de las muestras pueden calcularse los correspondientes
estadísticos descriptivos:
Por ejemplo, con reposición:
Las medias muestrales ( X) serían: 1; 1,5; 2; 1,5; 2; 2,5; 2; 2,5; y 3
Las varianzas muestrales (S2) serían: 0; 0,25; 1; 0,25; 0; 0,25; 1; 0,25; y 0
Estadísticos o Estimadores
Por tanto, los estadísticos son variables aleatorias que pueden adoptar
diferentes valores y que tienen su propia distribución de probabilidad.
En el ejemplo vemos que X puede tomar 5 posibles valores y que la
probabilidad que corresponde a cada uno de ellos (f (X i), su distribución) es:
No es necesario construir la distribución de un estadístico (p.e. de X ) en
todos los casos ya que cada estadístico tiene su propia distribución muestral
conocida.
Principales Distrib. en el muestreo
Las distribuciones muestrales de uso más frecuente en Estadística que aquí
estudiaremos serán:
DISTRIB. MUESTREO
Media Muestral X
Proporción Muestral p
Cuasivarianza muestral S2
Diferencias y sumas
Principales Distrib. en el muestreo
Distribución de muestreo de la media muestral:
Esta estadística tiene un papel muy importante en problemas de toma de
decisiones para medias poblacionales desconocidas.
Supóngase que se toma una muestra aleatoria de n observaciones de una
población (con cualquier distribución) con media  y con varianza finita 2.
Cada observación Xi : i=1, 2, ..., n, de la muestra aleatoria constituye una
variable aleatoria independiente, con la misma distribución que la
población que está siendo muestreada. (E[Xi] = ; V(Xi) = 2). Entonces, la
estadística:
+ + ...+ X n
X = X1 X2
=
n
n
1
Xi

i=1 n
se define como la media de las n v.a.i.i.d. o, sencillamente, media muestral.
Nótese que una vez que se conocen las realizaciones x1, x2, ..., xn de X1, X2, ...,
Xn, respectivamente, la realización x de X se obtiene promediando los datos
muestrales.
Principales Distrib. en el muestreo
La media (esperanza) de la distribución de esta media muestral, que se
simboliza por  es la misma que la media de la población, esto es:
x
1
1 n  1 n
EX    X  E   xi    EX i    n  EX   EX   
n
 n i 1  n i 1
La varianza de la distribución de la media muestral, que se simboliza por ,
es igual a la varianza de la población 2 dividida por el tamaño n de la
muestra. Esto es:
2
x
n
 1 2 n  1
2
2 1
 X     xi   2   xi   2
 n i1  n
 i1  n
n

i 1
2
Xi
2
1

 2  n  2 
n
n
La desviación típica (error típico) de la distribución de la media muestral
sería:
 X   X2 
Ver ejemplo inicial

n
Principales Distrib. en el muestreo
Si la variable original sigue una distribución Normal, la media muestral
sigue también una distribución Normal

2

X  N ( , )  X  N  ,
n
2

Si la variable original sigue una distribución cualquiera, pero el tamaño de
la muestra es suficientemente grande ( 30), dado que la media muestral es
igual a la suma de variables independientes de igual media y varianza,
aplicando el Teorema Central del Límite (que veremos a a continuación),
podemos decir que el estadístico media muestral se distribuye también
según una Normal, como antes.
Principales Distrib. en el muestreo
Ejemplo:
El CI de los alumnos de un centro especial de se distribuye
normalmente con media 80 y desviación típica 10. Si extraemos una
muestra aleatoria simple de 25 alumnos:
a)
b)
c)
d)
Si se extrae un sujeto al azar, ¿Cuál es la probabilidad de que
obtenga como mínimo una puntuación en CI de 75?
¿Cuál es la probabilidad de que su media aritmética sea mayor
de 75?
¿Cuál es la probabilidad de que su media aritmética sea como
máximo 83?
¿Qué valor debería tomar la media aritmética para que la
probabilidad de obtenerlo en esa muestra sea como máximo
0,85?
Principales Distrib. en el muestreo
Principales Distrib. en el muestreo
Distribución en el muestreo de proporciones:
Supongamos que una población es infinita y que la probabilidad de
ocurrencia de un suceso (su éxito) es p, mientras que la probabilidad de que
no ocurra es q=1-p. (Por ejemplo todas las posibles tiradas de una moneda,
en la que la probabilidad de cara es p=1/2). Esta población sigue una
distribución de Bernoulli. Queremos estimar la proporción de éxitos
poblacional (proporción de caras que han salido en todas las tiradas
posibles). Para ello consideramos todas las posibles muestras de tamaño n
de tal población, y para cada una de ellas determinamos la proporción
muestral de éxitos pˆ , que viene dada por:
n
+ + ...+ X n X
pˆ = X 1 X 2
= 
n
n
X
i
i=1
n
donde cada Xi se distribuye como una Bernoulli(p).
X = nº de éxitos en n intentos, por lo que X  B(n,p), cuya media sería n.p, y
desviación típica sería npq
Principales Distrib. en el muestreo
La media (esperanza) de la distribución de esta proporción muestral, así
como su varianza y su desviación típica (error típico) vienen dadas por las
siguientes expresiones:
pq
pq
E ( pˆ )  p

 p2ˆ 

 pˆ 
n
n
La distribución en el muestreo del estadístico proporción muestral de éxitos
seguiría una Binomial, cuya media y varianzas son los indicados arriba, que
no es más que el resultado de dividir por n los correspondientes a la
distribución Binomial de la variable original X (de hecho las probabilidades
asociadas al estadístico pˆ se obtienen de la tabla de la binomial de X.
Cuando n es suficientemente grande ( 30), se hace válida la aproximación
de la Binomial a la Normal, por lo que podemos considerar que el estadístico
proporción muestral sigue una distribución normal con los parámetros
siguientes:
 pˆ = p

 p2ˆ 
p*q
n

 pˆ =
p* q
=
n
p(1- p)
n
Principales Distrib. en el muestreo
Ejemplo
Distribución del número de aciertos en un test de 5 ítems con p = 0,50
Principales Distrib. en el
muestreo
Aproximación a la normal
Principales Distrib. en el muestreo
Distribución de muestreo de la cuasivarianza S2
Otra estadística importante empleada para formular inferencias con
respecto a las varianzas de la población es la varianza muestral denotada
por ˆ 2. El significado de ˆ 2 para formular inferencias de 2 es comparable
con el que tiene X para formular inferencias con respecto a .
Vamos a estudiar la distribución de muestreo de ˆ cuando este se lleva a
cabo sobre una población que tiene una distribución normal.
2
( -)
ˆ 2   X i
n
i=1
n
2
en donde X1, X2, ..., Xn constituyen una muestra aleatoria de una
distribución normal con media  y varianza 2 desconocida y lo que
queremos es determinar una distribución de muestreo que permita hacer
inferencias sobre 2 con base a ˆ 2como la hemos definido.
Principales Distrib. en el muestreo
Desde un punto de vista práctico, la varianza muestral tal y como la hemos
definido tiene poco uso, ya que es muy raro que se conozca el valor de la
media poblacional . De acuerdo con lo anterior, si se muestrea una
distribución normal con media  y varianza 2, la varianza muestral se
tendría que definir como:
n
( X i  X )2

V ( X )  i 1
n
donde se ha reemplazado la media desconocida  por la muestral X , dando
origen a la presencia de otra estadística en la definición de V(X).
La media o esperanza de la distribución en el muestreo de este estadístico
sería:
EV ( X )   
2
2
 n 1
  2 

n
n


como podemos comprobar numéricamente en el ejemplo inicial.
Principales Distrib. en el muestreo
El problema que tenemos con este estadístico es que no conocemos qué
distribución muestral sigue, (aunque sepamos que la distribución de partida
es Normal). Debemos buscar por tanto otro estadístico del que si
conozcamos su distribución en el muestreo, al menos, cuando la población
de partida es Normal. Este estadístico es la cuasivarianza muestral que se
2
n
define como:
(
X
)
Xi
2
(1)
S =
n
1
i=1
donde también se ha reemplazado la media desconocida  por la muestral X,
y se divide por (n - 1) para que sea un estimador insesgado de 2.
Si la distribución de partida es normal, entonces:
2
S (n - 1)
2
que es la estadística cuya distribución en el muestreo nos permite hacer
inferencias sobre 2 con base en S2, es una 2 con (n - 1) grados de libertad.
La media (esperanza) de este estadístico, su varianza y desviación típica
vienen dados por:
4
4
E(S 2 )   2

 S2 
2
2
n

S 
2
2
n
Principales Distrib. en el muestreo
Distribuciones en el muestreo de diferencias y sumas:
Supongamos que estamos interesados en estudiar dos poblaciones. Para
cada muestra de tamaño n1 de la primera, calculamos un estadístico T1; eso
da una distribución de muestreo para T1, cuya media y desviación típica
denotaremos por E[T1] y T1. Del mismo modo, para una muestra de
tamaño n2 de la segunda, calculamos un estadístico T2; eso da una
distribución de muestreo para T2 cuya media y desviación típica
denotaremos por E[T2] y T2.
De todas las posibles combinaciones de estas muestras de las dos
poblaciones podemos obtener una distribución de las diferencias T1 - T2, que
se llama Distribucion de muestreo de diferencias de los estadisticos. La media
(esperanza) y la desviación típica de esta distribución de muestreo,
denotadas respectivamente por E(T1 - T2) y (T1 - T2), vienen dadas por:
ET1  T2 = E T1   E T2 
 ( T -T ) =  T2 +  T2
1
2
1
2
supuesto que las muestras escogidas no dependen en absoluto una de otra
(sean independientes).
Principales Distrib. en el muestreo
Si T1 y T2 son las medias muestrales de ambas poblaciones, la notación
sería X 1 y X 2 respectivamente, entonces la distribución de muestreo de
las diferencias de medias, para poblaciones con medias y desviaciones
típicas (1, 1) (2, 2), respectivamente, viene dada por:

    
E X 1  X 2 = E X 1  E X 2 = 1 -  2
 ( X -X ) =  +
1
2
X1
2
2
X2
2
2


1
=
+ 2
n1
n2
A veces es útil hablar también de Distribución de muestreo de la suma de
estadísticos.
La media (esperanza) y la desviación típica de tal distribución son:
E T1  T2 = E T1   E T2 
 ( T T ) =  T2 +  T2
1
supuesto que las muestras sean independientes.
2
1
2
Teorema Central del Límite
Si X es la media de una muestra aleatoria de tamaño n que se toma de una
población con cualquier distribución (oblicua a la derecha, oblicua a la
izquierda, con forma de tina, etc...), cuya media es  y varianza finita 2,
entonces la forma límite de la distribución de:
X -
Z=

n
conforme n  , es la distribución normal estándar N (0,1).
¿Cómo de grande debe ser la muestra para que la aproximación sea
buena, empleando este procedimiento?
Esta aproximación normal para X generalmente será buena si n  30 sin
importar la forma de la población. Si la población es simétrica, es posible
obtener una buena aproximación con una n  10. Si se sabe que la
población es normal, la distribución muestral de seguirá exactamente una
distribución normal, sin importar el tamaño de la muestra.
Teorema Central del Límite
Ejemplo:
Considere la población formada por 6 bolas, en cada una de las cuales hay
pintado uno de los números 1, 1, 1, 2, 2, 3. El histograma de esta población es
oblicuo hacia la derecha alrededor de una media igual a 5/3. La población tiene
una varianza de 5/9.
población original
Valores posibles de
variable original (xi)
3/5
1/2
2/5
1/3
la 1
Prob. de aparición de cada
valor xi (pi)
1/5
0
3  1
6
2
2
2  1
6
3
0
1
n
   xi  p i 
i 1
1  3  2  2  3 1 10 5


6
6 3
1 n
1
2
 = ( xi -  ) * pi= [0.4356* 3 + 0.1156* 2 + 1.7956]= 0.5556= 5/9
n i=1
6
2
3
1
6
Teorema Central del Límite
Supongamos ahora que seleccionamos, con reemplazamiento, una muestra de
tamaño 2 (n=2) de esta población. La distribución de la media muestral tiene la
media y varianza siguientes:
Casos totales : C6  6  36
2
Valores posibles de
1
 (13,31,22)
2.5  (32,23)
3
 (33)
10 5
X =  = =
6
3

2
5/9 5

=
=
=
2
X
n
2
18
Probabilidad de aparición de los valores
X
2
 (11)
1.5  (12,21)
2
2
9
36
 Pr(11) 
C3
32

2
62
C6
1
1
1
1
1
1
C3 .C2 C2 .C3
6
6



2
2
36
36 36
C6
C6
1
1
1
1
1
1
10  Pr(13)  Pr(31)  Pr(22)  C3 .C1  C1 .C3  C2 .C2  3  3  4
2
2
2
36
36 36 36
C6
C6
C6
12
 Pr(12)  Pr(21) 
4
36
 Pr(32)  Pr(23) 
1
1
36
 Pr(33) 
1
1
C1 .C2 C2 .C1
2
2



2
2
36 36
C6
C6
1
C1 .C1
12

2
62
C6
Teorema Central del Límite
Podemos apreciar por su histograma que esta distribución de X sigue siendo aún
oblicua hacia la derecha. Pero aunque la población X no tiene tendencia para
suponer una forma de campana, la distribución para X comienza a mostrar algo de
una forma de campana.
1/3
2/7
1/4
1/5
1/7
0
X
0
0
1
Si tomamos todas las posibles muestras de tamaño 3 (n=3), la distribución de
tendría las siguientes media y varianza:
10
2
 X =  = = 1+
6
3

2
X
2
5/9 5

=
=
=
n
3
27
Teorema Central del Límite
1/3
2/7
1/4
1/5
1/7
0
0
0
1
La forma de campana de este histograma es más pronunciada que el de la figura
anterior. Si tomamos n cada vez mayor, veríamos los resultados del Teorema del
Límite Central demostrados visiblemente. El histograma llegaría a tomar la suave
forma de campana de la distribución normal. Podemos demostrar el mismo
fenómeno si muestreamos una población en la cual la proporción p tenga una
característica dada. En este caso la distribución tiene una media μp = p y una
varianza σ2p = p (1 - p)/n.
Ejercicios
Ejercicio 5.1
Un partido político cree que el 60% del electorado está a favor de su
programa. Como su líder encuentra que esta predicción es demasiado
optimista decide hacer un sondeo con una muestra de 90 personas.
¿Cuál será la probabilidad de que como máximo 60 personas estén a
favor de su partido?
Ejercicio 5.2
Disponemos de los datos del I.N.E. (Instituto Nacional de Estadística)
sobre el aumento del empleo durante el año 98, el cual se encuentra en
un 45%. Si tomamos una muestra aleatoria de 200 ciudadanos. ¿Cuál es
la probabilidad de que más del 50% tenga empleo?
Ejercicios
Ejercicio 5.3
La variable X se distribuye normalmente con media 50 y desviación
típica 12. Si extraemos una muestra aleatoria simple de 16 alumnos:
1) Si se extrae un sujeto al azar, ¿Cuál es la probabilidad de que
obtenga al menos una puntuación de 45?
2) ¿Cuál es la probabilidad de que su media aritmética sea menor de
58?
3) ¿Cuál es la probabilidad de que su media aritmética sea como
mínimo 45?
4) ¿Qué valores debería tomar la media aritmética para que exista
una probabilidad de 0,38 de encontrar valores entre ellos?