Estimación de parámetros poblacionales Sumario • Estimación puntual. • Estimación por intervalos de confianza. – De una media poblacional ( m ) • con s.
Download ReportTranscript Estimación de parámetros poblacionales Sumario • Estimación puntual. • Estimación por intervalos de confianza. – De una media poblacional ( m ) • con s.
Estimación de parámetros poblacionales Sumario • Estimación puntual. • Estimación por intervalos de confianza. – De una media poblacional ( m ) • con s conocida . • s desconocida. – De una proporción poblacional ( P ) • Presición y confiabilidad de una estimación por intervalo. • El tamaño de la muestra en función de la precisión y confiabilidad de la estimación. Estimación estadística • Operación que determina un valor numérico de un parámetro que caracteriza una población a partir del valor numérico de ese parámetro en una muestra Estimación puntual • Estamos interesados en realizar un estudio para describir las características del desarrollo físico en niñas cubanas entre 8 y 9 años de edad, por medio de la observación de algunas dimensiones antropométricas. Estimación puntual • La variable X (talla) se distribuye normal en la población cuyos parámetros µ y s, se desconocen, lo expresado es común escribirlo en la notación: X N (m, s) X se distribuye normal con media poblacional µ y desviación estándar poblacional s. Estimación puntual • Para continuar se ha tomado una muestra de tamaño n = 90 y queremos estimar la talla media y la desviación estándar. • x1, x2, x3,..., xn n x X= i X1+X2 +X3 +...+Xn n i=1 n x -x n i 2 S = i=1 n-1 S= S2 2 (X1 -X)2 +(X2 -X)2 +(X3 -X)2 +...+(Xn -X)2 = n-1 Estimación puntual • Si al realizar los cálculos apropiados se obtiene que: X 126.9 cm y S = 6.15 cm entonces esas cifras son las estimaciones de la media y la desviación estándar poblacionales, o sea, de m y s. Estimación puntual • La primera suposición que se hizo fue sobre el tipo de ley de distribución de la variable aleatoria talla en la población (NORMAL). • Sin hacer esa suposición no hubiese sido posible resolver el problema de estimación. • Después se hizo la selección de la muestra y se sustituyeron los valores en las fórmulas. • La utilidad práctica del estadígrafo radica en que por medio de un proceder de cálculo se obtiene un valor único, la estimación puntual. Estimación puntual • La media muestral X es un estimador de la media poblacional m, • La desviación estándar muestral S, sirve de estimador de la desviación estándar poblacional s. Estimación puntual • De igual forma, en el estudio de proporciones, la proporción muestral p sirve de estimador de la proporción poblacional P. a p= P n Estimación puntual • Constituye, en este esquema, un aspecto esencial la selección de la muestra, con la que, por sustitución de los valores observados en la expresión del estimador, hallamos un valor numérico (una estimación) que debe corresponder a un parámetro poblacional bajo estudio, descriptor de una propiedad de interés. Luego, por el momento lo que tenemos son estimaciones puntuales tanto de medias como de proporciones poblacionales. Estimación puntual • La incertidumbre en el proceso de selección de muestras aleatorias, deja en dudas la utilidad de la estimación puntual. • No se tiene información en relación con cuán cerca está el valor encontrado del verdadero valor del parámetro poblacional. • No conocemos si la diferencia entre la cifra estimada y el verdadero valor del parámetro es admisible o no. ESTIMACIÓN POR INTERVALOS DE CONFIANZA Estimación por intervalo de confianza • Una solución mejor, que incluye el error debido al muestreo. • Se conoce como intervalo de confianza para estimar un parámetro desconocido al intervalo aleatorio de la forma 1,2 , donde: 1Límite inferior 2Límite inferior • Que esperamos que contenga al parámetro con una Probabilidad dada. 95%, 99% PARA RECORDAR Distribución de la media muestral con varianza conocida • Si una variable aleatoria X sigue una distribución normal con media m y s conocida • Entonces la media muestral de tamaño n, sigue una distribución también normal con media m y desviación estándar igual a s dividida por la raíz del tamaño de muestra n. • Por consiguiente, la variable aleatoria Z obtenida mediante el procedimiento ya estudiado anteriormente sigue la normal estándar. Distribución de la media muestral con varianza conocida • Si X N (m , s ) , entonces X m,s n ) • Por consiguiente, la variable aleatoria Z obtenida mediante el procedimiento sigue la normal estándar. Z Xm s N ( 0 , 1 ) Z Xm s n Coeficiente de confianza. N ( 0 , 1 ) Distribución de la media muestral con varianza desconocida • Si se presenta una situación similar pero con s desconocida, entonces el estadígrafo definido es t y una distribución t-Student con n-1 grados de libertad. • Recordemos también que esta distribución para más de 30 observaciones se aproxima a la normal estándar. Distribución de la media muestral con varianza conocida • Si X N (m , s ) , con s desconocida. Xm t t (n-1) S n • Donde S es la desviación estándar de la muestra Intervalo de confianza para m con s conocida • Se denomina intervalo de confianza para m con nivel de confiabilidad del (1-a) ·100%, a la expresión: X Z1a s 2 n , X Z1a s 2 n • z1−a/2: percentil de orden 1−a/2 de la distribución normal estándar. • Si 1-a = 0,95 • Si 1-a = 0,99 Z1−a/2 = 1,96 Z1−a/2 = 2,58 Intervalo de confianza para m con s conocida • Se denomina intervalo de confianza para m con nivel de confiabilidad del (1-a) ·100%, a la expresión: X Z1a s 2 n , X Z1a s 2 n • z1−a/2: percentil de orden 1−a/2 de la distribución normal estándar. • Si 1-a = 0,95 • Si 1-a = 0,99 Z1−a/2 = 1,96 Z1−a/2 = 2,58 X Z1a s 2 n X Z1a s Intervalo de Confianza 2 n Ejemplo • Un cardiólogo desea hallar un intervalo de confianza del 95% para el nivel de colesterol promedio de todos los pacientes que presentan problemas cardíacos, asume que la distribución de los niveles de colesterol es normal con una desviación estándar s =0,47 y utiliza la siguiente muestra al azar de niveles de colesterol en mmol/L de 20 pacientes con problemas cardíacos. 4,7 5,0 4,2 5,3 4,8 4,4 5,2 4,3 4,6 5,1 4,2 6,0 4,9 4,3 5,2 4,7 4,5 5,2 4,2 4,8 • Primer paso: – Estimar el valor de m • Segundo paso: – Determinar el Coeficiente de Confianza “Z” • Tercer paso: – Determinar el Intervalo de Confianza • Cuarto paso: – Interpretar el Resultado 1 +x +...+x x X= 1 2 n n = 4.78 2 95% 1-a0.95 3 X Z0.975 s Z1−a/2 = 1,96 0, 47 4.78 1.96 4.78 0.21 n 20 4.78 – 0.21 , 4.78 + 0.21 4.57 , 4.99 4 Con un nivel de confiabilidad del 95 % podemos afirmar que el nivel de colesterol de todos los pacientes con problemas cardíacos se encuentra entre 4.57 y 4.99 mmol / litro 4.57 mmol / litro 4.99 mmol / litro Intervalo de Confianza Nivel de confiabilidad del 95 % Intervalo de confianza para m con s desconocida • Para n>30 X Z1a S 2 n , X Z1a S 2 n • z1−a/2: percentil de orden 1−a/2 de la distribución normal estándar. • Si 1-a = 0,95 • Si 1-a = 0,99 Z1−a/2 = 1,96 Z1−a/2 = 2,58 Intervalo de confianza para m con s desconocida • Para n<30 X tn-1,1a S 2 n , X tn-1 , 1a S 2 n • t n-1 , 1−a/2: percentil de orden 1−a/2 de la t-Student con n-1 grados de libertad Ejemplo • La distribución del total de las calificaciones en siete pruebas efectuadas se comportan normalmente. • Se extrae una muestra de 40 estudiantes que realizaron las pruebas y se obtienen los siguientes datos: 658 654 657 642 562 565 721 704 731 669 635 641 710 710 617 721 679 654 795 767 n >30 631 720 580 625 694 729 689 741 663 700 638 694 615 617 689 689 623 683 710 702 • Primer paso: – Estimar el valor de my s • Segundo paso: – Determinar el Coeficiente de Confianza “Z” • Tercer paso: – Determinar el Intervalo de Confianza • Cuarto paso: – Interpretar el Resultado 1 +x +...+x x X= 1 2 n n = 673.10 X -X X -X X -X 2 S= 1 + 2 +...+ 2 2 n n-1 2 95% 1-a0.95 Z1−a/2 = 1,96 =51,86 3 X ± Z0.95 ×S 51.86 = 673.10 ± 1.96 × = 673.10 ± 16.59 n 40 673.10 – 16.59 , 673.10 + 16.59 656.51 , 689.69 4 Con un nivel de confiabilidad del 95 % podemos afirmar que el total promedio en las pruebas de ingreso de todos los estudiantes se encuentra entre 656.51 y 689.69. 656.51 689.69 Intervalo de Confianza Nivel de confiabilidad del 95 % Estimación por intervalos de confianza de una proporción poblacional ( P ) • Al igual que sucede con la media muestral, para muestras grandes este sigue una distribución NORMAL con media P y varianza P.Q dividido por el tamaño de la muestra. p ~ N ( P , PQ • Donde Q = 1 – P n ) • Primer paso: – Estimar el valor de P • Segundo paso: a p n – Determinar el Coeficiente de Confianza “Z” 95% Z1−a/2 = 1,96 99% Z1−a/2 = 2,58 • Tercer paso: – Determinar el Intervalo de Confianza p ± Z1-α . p . q 2 n • Cuarto paso: – Interpretar el Resultado "q= 1-p" Ejemplo • Se quiere hallar un intervalo de confianza con el 95 % de confiabilidad para la proporción en la población, de enfermos de estomatitis subprótesis. Se realiza un pesquizaje en portadores de prótesis estomatológicas de Ciudad de La Habana, efectuándose para ello, la selección de una muestra aleatoria de 50 portadores, y se encuentra que 25 padecían de la citada enfermedad. 1 a 25 p= = = 0.5 n 50 2 95% Z1−a/2 = 1,96 3 p ± Z1-α . p . q 2 n 0.5 ± 1.96 . 0.5 . 0.5 "q= 1-p" 50 = 0.5 ± 0.14 IC: 0.36 , 0.64 4 Con un nivel de confiabilidad del 95 % podemos afirmar que la verdadera proporción de enfermos de estomatitis subprótesis en la población se encuentra entre 0.36 y 0.64 : TAMAÑO DE LA MUESTRA Precisión: d = Z1a . s 2 n Tamaño de la muestra: 2 S n = (Z1-α . ) d 2 ¿De qué factores depende el tamaño de la muestra? FACTORES PARA DETERMINAR EL TAMAÑO DE LA MUESTRA 1. Variabilidad del universo que se estudia. 2. Precisión que se quiere de los resultados. 3. Confiabilidad que se desea obtener. EJEMPLO Supongamos que se quiere hacer una estimación por intervalo de confianza para la media de la población de tallas de niñas de 7 años. Se selecciona una muestra aleatoria de niñas para estimar la media poblacional y se desea alcanzar una precisión de 1 cm. Si se conoce que la desviación estándar de la talla en la población es 5.53cm, con una confiabilidad del 95 %. ¿Cuál sería un tamaño de muestra adecuado? TAMAÑO DE LA MUESTRA Fórmula del tamaño de la muestra: n = (z1−a/2 s / d)2 n = (1,96 . 5,53 / 1)2 n = 118 Estimador y Estimación Llamamos estimador a una función de los elementos de una muestra aleatoria mientras que llamamos estimación a la cifra numérica o valor observado del estimador, obtenida por sustitución de los valores muestrales en la expresión del estimador. Intervalos de Confianza Los intervalos de confianza se construyen como función de los valores observados en la muestra y nos permiten afirmar que el parámetro desconocido se encuentra entre ciertos valores con un determinado nivel de confiablidad.