Prueba t varianzas combinadas

Download Report

Transcript Prueba t varianzas combinadas

COMPARACIÓN DE
DOS MUESTRAS
INDEPENDIENTES
PRUEBAS “t” PARA LA DIFERENCIA ENTRE
DOS MEDIAS.
HO: μ1 = μ2
o lo mismo que μ1 - μ2 = 0
H1: μ1
o lo mismo que μ1 - μ2
μ2
Profesor Juan Díaz Valencia, Esp. Estadística Aplicada,
0
[email protected]
PRUEBA t DE VARIANZA COMBINADA PARA LA DIFERENCIA
ENTRE DOS MEDIAS.
El estadístico de prueba usado para determinar la diferencia entre las
medias poblacionales se basa en la diferencia entre las medias
muestrales.
, este estadístico sigue una distribución normal
estándar para muestras suficientemente grandes.
La prueba Z para la diferencia entre dos medias es la siguiente
En la mayoría de casos no se conoce la varianza o las desviaciones
estándar de las poblaciones, la única información que podemos
obtener se relaciona con las medias muestrales.
Si se hace la suposición que las que las muestras se obtienen de manera
aleatoria e independiente a partir de poblaciones respectivas que tienen
distribución normal y las varianzas son iguales es decir
, se
puede usar una prueba “t” de varianzas combinadas, para determinar si
existe diferencias significativas entre las medias de las dos poblaciones.
Se debe probar la hipótesis nula de que no hay diferencias entre las
medias de las dos poblaciones.
HO: μ1 = μ2
H1: μ1 μ2
o lo mismo que μ1 - μ2 = 0
o lo mismo que μ1 - μ2 0
Se usa el estadístico de prueba t de varianzas combinadas para
probar la diferencia entre medias.
Prueba t de varianzas combinadas para la diferencia entre
medias
Donde:
Es la varianza combinada
El estadístico de prueba t sigue una distribución t con
Grados de libertad para un nivel de significancia α dado.
CRITERIOS PARA RECHAZAR LA HIPÓTESIS NULA
Para un nivel de significancia α, se rechaza la hipótesis nula si el
estadístico de prueba t calculado,
superior
excede el valor crítico de la cola
de la distribución t, o si el estadístico de prueba
calculado es menor que el valor crítico de la cola inferior –
la distribución t.
Se rechaza H0 si t >
o si t < De otra manera no se rechaza H0.
de
REGIONES DE RECHAZO PARA UNA PRUEBA DE DOS
COLAS PARA LA DIFERENCIA ENTRE DOS MEDIAS
Ejemplo.
El jefe de control de calidad de una embotelladora desea
comparar el llenado de líquido de una bebida a dos diferentes
presiones operativas de 25 y 30 PSI. Para esto selecciona dos
muestras de 10 envases cada una de poblaciones que tienen
varianzas iguales, el ingeniero entonces utiliza una prueba t de
varianzas combinadas utilizando un nivel de significancia α = 0,05
los datos se muestran en la siguiente tabla.
25psi
-2,8
-1,6
0,2
1,2
-2
-1
1,4
3,4
0,6
0,9
30psi
0,2
2,1
2,6
0,4
1,7
3,3
1,6
4
2,7
3,4
Ejemplo para la medición del
LLENADO DE LÍQUIDO EN UNA BOTELLA
Prueba t para dos muestras suponiendo
varianzas iguales
Media
Varianza
Observaciones
Varianza agrupada (combinada)
Diferencia hipotética de las medias
Grados de libertad
Estadístico t
P(T<=t) una cola
Valor crítico de t (una cola)
P(T<=t) dos colas
Valor crítico de t (dos colas)
25psi
30psi
0,03
2,2
3,50678 1,5733
10
10
2,54006
0
18
-3,0446
0,00349
1,73406
0,00697
2,10092
Prueba de hipótesis de dos colas para la diferencia
entre medias a un nivel de significancia de 0,05 con
18 grados de libertad.
Conclusión.
Como t calculado = - 3,0446 < - 2,10092.
Se observa que el estadístico de prueba t, se encuentra en la
región de rechazo, por lo tanto rechazamos H0.
Existe suficiente evidencia de una diferencia en la desviación
promedio de la meta de cantidad de llenado de la bebida con
dos niveles de presión operativa. Al usar una presión de 25 PSI,
el resultado es una desviación significativamente menor de la
meta que la obtenida por el control a 30 PSI.
Otra manera de rechazar o no la hipótesis nula es mediante el
p-value, si observamos la tabla de resultados p ≈ 0,007 < 0,05.
luego se tiene suficiente evidencia de que H0 no es cierta y se
rechaza.
Intervalo de confianza para μ1 – μ2,
varianzas desconocidas
pero
Si
son las medidas de muestras aleatorias
independientes con tamaños n1 y n2, respectivamente, de
poblaciones aproximadamente normales con varianzas iguales
pero desconocidas, un intervalo de confianza de (1 – α) 100%
para μ1- μ2 esta dada por:
Es la varianza combinada
El estadístico de prueba t sigue una distribución t con
Grados de libertad para un nivel de significancia α dado.
Ejemplo.
Se eligieron dos estaciones de muestreo independientes para un estudio,
una que se localiza corriente abajo del punto de descarga de ácido
proveniente de una mina, la otra corriente arriba, para 12 muestras
mensuales del rio corriente abajo se obtuvo un valor medio de 3,11 y una
desviación estándar muestral de 0,771, mientras que 10 muestras corriente
arriba arrojaron una media de 2,04 y una desviación estándar de 0,448.
encuentre un intervalo de confianza de 90% para la diferencia entre medias
poblacionales de los sitios, suponga que las dos poblaciones están
distribuidas normalmente con varianzas iguales.
Muestre que el intervalo al simplificarlo
queda:
0,593 < μ1 – μ2 < 1,547.
Ejercicio 1.
Se comparan las resistencias de dos clases de hilo, 50 piezas de cada
clase de hilo se prueban bajo condiciones similares, la marca A tiene una
resistencia a la tracción de 78,3 kilogramos, con una desviación estándar
de 5,6 kilogramos, mientras que la marca B tiene una resistencia a la
tracción promedio de 87,2 kilogramos con una desviación estándar de 6,3
kilogramos, construya un intervalo de confianza del 95% para la
diferencia entre medias.
Ejercicio 2.
Una agencia de bienes raíces desea comparar los avalúos de casas
unifamiliares en dos comunidades, una muestra de 60 casas en
Farmingdale y 99 casas en Levittown, los resultados se muestran en miles
de dólares. Para un nivel de significancia de 0,05 ¿existe una diferencia
en el valor promedio de los avalúos en las dos comunidades?
Farmingdale Levittown
191,33
172,34
S
32,60
16,92
N
60
99