Estimación de parámetros poblacionales Sumario • Estimación puntual. • Estimación por intervalos de confianza. – De una media poblacional ( m ) • con s.

Download Report

Transcript Estimación de parámetros poblacionales Sumario • Estimación puntual. • Estimación por intervalos de confianza. – De una media poblacional ( m ) • con s.

Estimación de parámetros
poblacionales
Sumario
• Estimación puntual.
• Estimación por intervalos de confianza.
– De una media poblacional ( m )
• con s conocida .
• s desconocida.
– De una proporción poblacional ( P )
• Presición y confiabilidad de una estimación por
intervalo.
• El tamaño de la muestra en función de la
precisión y confiabilidad de la estimación.
Estimación estadística
• Operación que determina un valor
numérico de un parámetro que caracteriza
una población a partir del valor numérico
de ese parámetro en una muestra
Estimación puntual
• Estamos interesados en realizar un
estudio para describir las
características del desarrollo físico en
niñas cubanas entre 8 y 9 años de edad,
por medio de la observación de algunas
dimensiones antropométricas.
Estimación puntual
• La variable X (talla) se distribuye normal en la
población cuyos parámetros µ y s, se
desconocen, lo expresado es común escribirlo en
la notación:
X  N (m, s)
X se distribuye normal con media poblacional µ y
desviación estándar poblacional s.
Estimación puntual
• Para continuar se ha tomado una muestra de
tamaño n = 90 y queremos estimar la talla media
y la desviación estándar.
• x1, x2, x3,..., xn
n
x
X=
i
X1+X2 +X3 +...+Xn

n
i=1
n
  x -x 
n
i
2
S =
i=1
n-1
S= S2
2
(X1 -X)2 +(X2 -X)2 +(X3 -X)2 +...+(Xn -X)2
=
n-1
Estimación puntual
• Si al realizar los cálculos apropiados se obtiene
que:
X  126.9 cm y S = 6.15 cm
entonces esas cifras son las estimaciones de la
media y la desviación estándar poblacionales, o
sea, de m y s.
Estimación puntual
• La primera suposición que se hizo fue sobre el
tipo de ley de distribución de la variable aleatoria
talla en la población (NORMAL).
• Sin hacer esa suposición no hubiese sido posible
resolver el problema de estimación.
• Después se hizo la selección de la muestra y se
sustituyeron los valores en las fórmulas.
• La utilidad práctica del estadígrafo radica en que
por medio de un proceder de cálculo se obtiene
un valor único, la estimación puntual.
Estimación puntual
• La media muestral X es un estimador de la media
poblacional m,
• La desviación estándar muestral S, sirve de
estimador de la desviación estándar poblacional
s.
Estimación puntual
• De igual forma, en el estudio de proporciones, la
proporción muestral p sirve de estimador de la
proporción poblacional P.
a
p=  P
n
Estimación puntual
• Constituye, en este esquema, un aspecto esencial
la selección de la muestra, con la que, por
sustitución de los valores observados en la
expresión del estimador, hallamos un valor
numérico (una estimación) que debe corresponder
a un parámetro poblacional bajo estudio,
descriptor de una propiedad de interés. Luego, por
el momento lo que tenemos son
estimaciones puntuales tanto de medias como
de proporciones poblacionales.
Estimación puntual
• La incertidumbre en el proceso de selección de
muestras aleatorias, deja en dudas la utilidad de la
estimación puntual.
• No se tiene información en relación con cuán
cerca está el valor encontrado del verdadero valor
del parámetro poblacional.
• No conocemos si la diferencia entre la cifra
estimada y el verdadero valor del parámetro es
admisible o no.
 ESTIMACIÓN POR INTERVALOS DE CONFIANZA
Estimación por intervalo de confianza
• Una solución mejor, que incluye el error debido al
muestreo.
• Se conoce como intervalo de confianza para estimar
un parámetro desconocido  al intervalo aleatorio de
la forma 1,2 , donde:
1Límite inferior
2Límite inferior
• Que esperamos que
contenga al parámetro con
una Probabilidad dada.
95%, 99%
PARA RECORDAR
Distribución de la media muestral
con varianza conocida
• Si una variable aleatoria X sigue una distribución
normal con media m y s conocida
• Entonces la media muestral de tamaño n, sigue
una distribución también normal con media m y
desviación estándar igual a s dividida por la raíz
del tamaño de muestra n.
• Por consiguiente, la variable aleatoria Z obtenida
mediante el procedimiento ya estudiado
anteriormente sigue la normal estándar.
Distribución de la media muestral
con varianza conocida
• Si X  N (m , s ) , entonces X m,s
n
)
• Por consiguiente, la variable aleatoria Z obtenida
mediante el procedimiento sigue la normal
estándar.
Z
Xm
s
N ( 0 , 1 )

Z
Xm
s
n
Coeficiente de confianza.
N ( 0 , 1 )
Distribución de la media muestral
con varianza desconocida
• Si se presenta una situación similar pero con s
desconocida, entonces el estadígrafo definido es t
y una distribución t-Student con n-1 grados de
libertad.
• Recordemos también que esta distribución para
más de 30 observaciones se aproxima a la normal
estándar.
Distribución de la media muestral
con varianza conocida
• Si X  N (m , s ) , con s desconocida.

Xm
t
 t (n-1)
S
n
• Donde S es la desviación estándar de la muestra
Intervalo de confianza
para m con s conocida
• Se denomina intervalo de confianza para m con
nivel de confiabilidad del (1-a) ·100%, a la
expresión:
X  Z1a  s
2
n
, X  Z1a  s
2
n
• z1−a/2: percentil de orden 1−a/2
de la distribución normal estándar.
• Si 1-a = 0,95
• Si 1-a = 0,99
Z1−a/2 = 1,96
Z1−a/2 = 2,58
Intervalo de confianza
para m con s conocida
• Se denomina intervalo de confianza para m con
nivel de confiabilidad del (1-a) ·100%, a la
expresión:
X  Z1a  s
2
n
, X  Z1a  s
2
n
• z1−a/2: percentil de orden 1−a/2
de la distribución normal estándar.
• Si 1-a = 0,95
• Si 1-a = 0,99
Z1−a/2 = 1,96
Z1−a/2 = 2,58
X  Z1a  s
2
n
X  Z1a  s
Intervalo de Confianza
2
n
Ejemplo
• Un cardiólogo desea hallar un intervalo de
confianza del 95% para el nivel de colesterol
promedio de todos los pacientes que presentan
problemas cardíacos, asume que la distribución de
los niveles de colesterol es normal con una
desviación estándar s =0,47 y utiliza la siguiente
muestra al azar de niveles de colesterol en mmol/L
de 20 pacientes con problemas cardíacos.
4,7
5,0
4,2
5,3
4,8
4,4
5,2
4,3
4,6
5,1
4,2
6,0
4,9
4,3
5,2
4,7
4,5
5,2
4,2
4,8
• Primer paso:
– Estimar el valor de m
• Segundo paso:
– Determinar el Coeficiente de Confianza “Z”
• Tercer paso:
– Determinar el Intervalo de Confianza
• Cuarto paso:
– Interpretar el Resultado
1
+x +...+x
x
X=
1
2
n
n
= 4.78
2
95% 1-a0.95
3
X  Z0.975  s
Z1−a/2 = 1,96
0, 47
 4.78  1.96 
 4.78  0.21
n
20
4.78 – 0.21 , 4.78 + 0.21
4.57 , 4.99
4
Con un nivel de confiabilidad del 95 % podemos
afirmar que el nivel de colesterol de todos los
pacientes con problemas cardíacos se encuentra
entre 4.57 y 4.99 mmol / litro
4.57 mmol / litro
4.99 mmol / litro
Intervalo de Confianza
Nivel de confiabilidad del 95 %
Intervalo de confianza
para m con s desconocida
• Para n>30
X  Z1a  S
2
n
, X  Z1a  S
2
n
• z1−a/2: percentil de orden 1−a/2
de la distribución normal estándar.
• Si 1-a = 0,95
• Si 1-a = 0,99
Z1−a/2 = 1,96
Z1−a/2 = 2,58
Intervalo de confianza
para m con s desconocida
• Para n<30
X  tn-1,1a  S
2
n
, X  tn-1 , 1a  S
2
n
• t n-1 , 1−a/2: percentil de orden 1−a/2
de la t-Student con n-1 grados de libertad
Ejemplo
• La distribución del total de las calificaciones en
siete pruebas efectuadas se comportan
normalmente.
• Se extrae una muestra de 40 estudiantes que
realizaron las pruebas y se obtienen los
siguientes datos:
658
654
657
642
562
565
721
704
731
669
635
641
710
710
617
721
679
654
795
767
n >30
631
720
580
625
694
729
689
741
663
700
638
694
615
617
689
689
623
683
710
702
• Primer paso:
– Estimar el valor de my s
• Segundo paso:
– Determinar el Coeficiente de Confianza “Z”
• Tercer paso:
– Determinar el Intervalo de Confianza
• Cuarto paso:
– Interpretar el Resultado
1
+x +...+x
x
X=
1
2
n
n
= 673.10
 X -X  X -X  X -X
2
S=
1
+
2
+...+
2
2
n
n-1
2
95% 1-a0.95
Z1−a/2 = 1,96
=51,86
3
X ± Z0.95
×S
51.86
= 673.10 ± 1.96 ×
= 673.10 ± 16.59
n
40
673.10 – 16.59 , 673.10 + 16.59
656.51 , 689.69
4
Con un nivel de confiabilidad del 95 % podemos
afirmar que el total promedio en las pruebas de
ingreso de todos los estudiantes se encuentra
entre 656.51 y 689.69.
656.51
689.69
Intervalo de Confianza
Nivel de confiabilidad del 95 %
Estimación por intervalos de confianza de
una proporción poblacional ( P )
• Al igual que sucede con la media muestral, para
muestras grandes este sigue una distribución
NORMAL con media P y varianza P.Q dividido
por el tamaño de la muestra.
p ~ N ( P , PQ
• Donde Q = 1 – P
n
)
• Primer paso:
– Estimar el valor de P
• Segundo paso:
a
p
n
– Determinar el Coeficiente de Confianza “Z”
95%
Z1−a/2 = 1,96
99%
Z1−a/2 = 2,58
• Tercer paso:
– Determinar el Intervalo de Confianza
p ± Z1-α . p . q
2
n
• Cuarto paso:
– Interpretar el Resultado
"q= 1-p"
Ejemplo
• Se quiere hallar un intervalo de confianza con el
95 % de confiabilidad para la proporción en la
población, de enfermos de estomatitis subprótesis.
Se realiza un pesquizaje en portadores de prótesis
estomatológicas de Ciudad de La Habana,
efectuándose para ello, la selección de una
muestra aleatoria de 50 portadores, y se encuentra
que 25 padecían de la citada enfermedad.
1
a
25
p=
=
= 0.5
n
50
2
95% 
Z1−a/2 = 1,96
3
p ± Z1-α . p . q
2
n
0.5 ± 1.96 . 0.5 . 0.5
"q= 1-p"
50
= 0.5 ± 0.14
IC: 0.36 , 0.64
4
Con un nivel de confiabilidad del 95 % podemos
afirmar que la verdadera proporción de enfermos
de estomatitis subprótesis en la población se
encuentra entre 0.36 y 0.64 :
TAMAÑO DE LA MUESTRA
Precisión: d = Z1a . s
2
n
Tamaño de la muestra:
2
S
n = (Z1-α . )
d
2
¿De qué factores depende el
tamaño de la muestra?
FACTORES PARA DETERMINAR
EL TAMAÑO DE LA MUESTRA
1. Variabilidad del universo que se estudia.
2. Precisión que se quiere de los resultados.
3. Confiabilidad que se desea obtener.
EJEMPLO
Supongamos que se quiere hacer una estimación
por intervalo de confianza para la media de la
población de tallas de niñas de 7 años. Se
selecciona una muestra aleatoria de niñas para
estimar la media poblacional y se desea alcanzar
una precisión de 1 cm. Si se conoce que la
desviación estándar de la talla en la población es
5.53cm, con una confiabilidad del 95 %. ¿Cuál sería
un tamaño de muestra adecuado?
TAMAÑO DE LA MUESTRA
Fórmula del tamaño de la muestra:
n = (z1−a/2 s / d)2
n = (1,96 . 5,53 / 1)2
n = 118
Estimador y Estimación
Llamamos estimador a una función de
los elementos de una muestra aleatoria
mientras que llamamos estimación a la
cifra numérica o valor observado del
estimador, obtenida por sustitución de
los valores muestrales en la expresión
del estimador.
Intervalos de Confianza
Los intervalos de confianza se construyen
como función de los valores observados
en la muestra y nos permiten afirmar que
el parámetro desconocido se encuentra
entre ciertos valores con un determinado
nivel de confiablidad.