Análisis para 2 colas

Download Report

Transcript Análisis para 2 colas

Estadística Administrativa II
2014-3
Análisis de Varianza
Distribución F
› Prueba de dos muestras con varianzas iguales
› Comparación de varias medias poblacionales en forma
simultánea
› Análisis de Varianza (ANOVA)
› Distribución normal
› Datos en escala de intervalos
𝐺𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑 𝑛𝑢𝑚𝑒𝑟𝑎𝑑𝑜𝑟
𝑃𝑎𝑟á𝑚𝑒𝑡𝑟𝑜𝑠:
𝐺𝑟𝑎𝑑𝑜𝑠 𝑑𝑒 𝑙𝑖𝑏𝑒𝑟𝑡𝑎𝑑 𝑑𝑒𝑛𝑜𝑚𝑖𝑛𝑎𝑑𝑜𝑟
Distribución F
Características
› Distribución continua
› Distribución no negativa
› Sesgo positivo
› Asintótica
La hipótesis se prueba a través de las varianzas
Comparación de dos
varianzas poblacionales
Estadístico de prueba para comparar
dos varianzas
Análisis para 2 colas
𝐹=
𝐻0 : 𝜎12 = 𝜎22
𝐻𝑎 : 𝜎12 ≠ 𝜎22
2
𝑠1
2
𝑠2
Ejemplo 1 . . .
Lammers Co. ofrece servicio de limusina de Toledo, Ohio al
aeropuerto metropolitano de Detroit; el recorrido se hace por
2 rutas; la carretera 25 y la autopista I-75. Se desea estudiar
el tiempo que tardaría en conducir al aeropuerto por cada
una de las rutas. Usando el nivel de significancia de 0.10.
¿Hay alguna diferencia entre las variaciones de los tiempos
de manejo por las dos rutas.
El tiempo medio por la carretera 25 es de 58.29 minutos y por
la autopista I-75 es de 59 minutos. Los tiempos de variación
de la muestra entre cada recorrido es una desviación
estándar de 8.9947’ para la carretera 25 y 4.3753 para la
autopista I-75.
. . . Ejemplo 1
La distancia por la autopista I-75 es más larga que por la
carretera 24. Es importante que el servicio sea tanto puntual
como consistente, por lo que se realizará una prueba
estadística para determinar si existe una diferencia en las
variaciones entre ambas rutas. Para lo cual se tomó una
muestra de 7 recorridos por la carretera 25 y 8 por la
autopista I-75.
›
2
𝐻0 : 𝜎25
=
2
𝜎𝐼−75
2
2
𝐻𝑎 : 𝜎25
≠ 𝜎𝐼−75
› 𝛼 = 0.10
𝐹=
2
𝑠1
2
𝑠2
. . . Ejemplo 1
› Regla de decisión
2 colas
𝛼 = 0.10
𝑛1 = 7
𝑛2 = 8
𝑔𝑙1 = 6
𝑔𝑙2 = 7
𝑏𝑢𝑠𝑐𝑎𝑟 𝑒𝑙 𝑣𝑎𝑙𝑜𝑟 𝑑𝑒 𝑓 𝑒𝑛 𝑙𝑎 𝑡𝑎𝑏𝑙𝑎 𝑑𝑒 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢𝑐𝑖ó𝑛
𝑓 = 3.87
.
Población 1 = C-25
. . Ejemplo 1
Población 2 = I-75
› Toma de decisión con los datos de la muestra
𝑠1 = 8.9947
𝑠2 = 4.3753
𝑛1 = 7
𝑛2 = 8
𝑠12
8.9947
𝐹= 2=
4.3753
𝑠𝑠
2
2
= 4.23
La hipótesis nula no se acepta.
Se concluye que existe una diferencia entre las variaciones
de los tiempos recorridos por las dos rutas.
Comparación de dos
varianzas poblacionales
Estadístico de prueba para comparar
dos varianzas
Análisis para 1 cola
𝐹=
𝐻0 : 𝜎12 > 𝜎22
𝐻𝑎 : 𝜎12 ≤ 𝜎22
2
𝑠1
2
𝑠2
Ejemplo . . .
Steele Electric Products, ensambla componentes electricos
para teléfonos celulares. Durante los últimos 10 días Mark
Nagy ha promediado 9 productos rechazados, con una
desviación estándar de 2 rechazos por día. Debbie Richmond
promedio 8.5 productos rechazados, con una desviación
estándar de 1.5 rechazos durante el mismo periodo. Con un
nivel de significancia de 0.05, ¿podría concluir que hay mas
variación en el numero de productos rechazados por día en la
muestra de Mark?
𝑛 = 10 𝑎𝑚𝑏𝑎𝑠 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠
𝑃𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 1
𝑃𝑜𝑏𝑙𝑎𝑐𝑖ó𝑛 2
𝑠1 = 2
𝑠2 = 1.5
𝑋1 = 9
𝑋2 = 8.5
. . . Ejemplo
› 𝐻0 : 𝜎12 < 𝜎22
𝐻𝑎 : 𝜎12 ≥ 𝜎22
› 𝛼 = 0.05
› 𝐹=
𝑠12
𝑠22
› Regla de decisión
1 𝑐𝑜𝑙𝑎
𝑛1 = 10 ≡ 𝑔𝑙1 = 9
𝑛2 = 10 ≡ 𝑔𝑙2 = 9
𝛼 = 0.05
𝐹 = 3.18
. . . Ejemplo
› Con los datos de la muestra tomar la decisión
𝑠12
2 2
𝐹= 2=
= 1.78
2
1.5
𝑠2
1.78 < 3.18
La hipótesis nula no se rechaza
La variación es la misma para ambos empleados
Análisis de varianza
(ANOVA)
Múltiples medias poblacionales
𝐻0 : 𝜎12 > 𝜎22
𝐻𝑎 : 𝜎12 ≤ 𝜎22
𝐹=
2
𝑠1
2
𝑠2
ANOVA
ANOVA se desarrolló para aplicaciones en agricultura, y aún
se emplean muchos de los términos relacionados con ese
contexto. En particular, con el termino tratamiento se
identifican las poblaciones diferentes que se examinan.
Por ejemplo, el tratamiento se refiere a cómo una extensión
de terreno se trató con un tipo particular de fertilizante.
Características de ANOVA
› Poblaciones distribuidas normalmente
› Desviación estándar iguales
› Poblaciones independientes
› Posibilidad de error tipo I si se utiliza la comparación de
medias poblacionales
Cálculos ANOVA
1. Media Global
Calcular la media de todas las muestras extraídas
(𝑋𝑔 )
𝑥𝑖
2. Variación total
Resta de cada dato y la media global
(𝑥𝑖 − 𝑋𝑔 ), elevar al cuadrado y sumar los resultados
3. Variación de tratamiento
Resta de cada media de la muestra y la media
global, una por cada dato, elevar al cuadrado y
sumar los resultados
𝑥𝑖 − 𝑋𝑔
𝑛𝑖 𝑋𝑖 − 𝑋𝑔
4. Variación aleatoria
Resta de cada dato a su respectiva media, elevar al
cuadrado y sumar los resultados
2
𝑥𝑖 − 𝑋𝑗
2
2
Cálculos ANOVA
5. Varianza 1
𝑠12
𝑉𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑑𝑒 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜
=
𝑀𝑢𝑒𝑠𝑡𝑟𝑎𝑠 − 1
6. Varianza 2
𝑠22
𝑉𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎
=
𝑡𝑎𝑚𝑎ñ𝑜 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑔𝑙𝑜𝑏𝑎𝑙 − 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠
7. Distribución F
𝑠𝑡2 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑑𝑒 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜
𝐹= 2=
𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎
𝑠𝑎
Ejemplo 1 . . .
Joan Kulman es la gerente de un centro financiero y desea
comparar la productividad de los empleados en su atención al
cliente, Toma de base 3 empleados y revisa el número de
clientes que atendieron durante 4 días. Los resultados de las
muestras son:
LOBO
55
54
59
56
BLANCO
66
76
67
71
COREA
47
51
46
48
Media global
55 + 54 + 59 + 56 + 66 + 76 + 67 + 71 + 47 + 51 + 46 + 48
𝑋𝑔 =
= 58
12
. . . Ejemplo 1
LOBO
55
54
59
56
56
Variación Total
𝑥𝑖 − 𝑋𝑔
2
= 55 − 58
2
+ 54 − 58
2
+ 59 − 58
BLANCO
66
76
67
71
70
2
COREA
47
51
46
48
48
+ 56 − 58
+ 66 − 58
2
+ 76 − 58
2
+ 67 − 58
2
+ 71 − 58
+ 47 − 58
= 1082
2
+ 51 − 58
2
+ 46 − 58
2
+ 48 − 58
2
2
Variación Tratamiento
𝑛𝑖 𝑋𝑖 − 𝑋𝑔
2
= 4 56 − 58
2
+ 4 70 − 58
= 992
2
+ 4 48 − 58
2
2
. . . Ejemplo 1
LOBO
55
54
59
56
56
Variación Aleatoria
𝑥𝑖 − 𝑋𝑗
2
= 55 − 56
2
+ 54 − 56
2
+ 59 − 56
BLANCO
66
76
67
71
70
2
COREA
47
51
46
48
48
+ 56 − 56
+ 66 − 70
2
+ 76 − 70
2
+ 67 − 70
2
+ 71 − 70
+ 47 − 48
= 90
2
+ 51 − 48
2
+ 46 − 48
2
+ 48 − 48
2
2
Varianzas
𝑠𝑡2
992
992
=
=
= 496
3−1
2
496
𝐹=
= 49.6
10
𝑠𝑎2
90
90
=
=
= 10
12 − 3
9
2
Prueba de hipótesis
ANOVA
Ejemplo . . .
Metroya es una empresa de investigación de mercados
que analizó el comportamiento de los pasajeros de 4
aerolíneas. Diseñó una encuesta valorada en 100 puntos
para medir la satisfacción de los clientes. Con un nivel de
significancia de 0.01 procesar las 4 muestras obtenidas.
Eastern
94
90
85
80
TWA
75
68
77
83
88
TACA
70
73
76
78
80
68
65
AA
68
70
72
65
74
65
Determinar si hay alguna
diferencia en el nivel de
satisfacción medio entre
las 4 aerolíneas
. . . Ejemplo
› 𝐻0 : 𝜇1 = 𝜇2 = 𝜇3 = 𝜇4
𝐻𝑎 : 𝑁𝑜 𝑡𝑜𝑑𝑎𝑠 𝑙𝑎 𝜇 𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠
› 𝛼 = 0.01
› Estadístico 𝐹 =
𝑠12
𝑠22
Eastern
94
90
85
80
TWA
75
68
77
83
88
› Regla de decisión
2 colas
𝛼 = 0.01
Grados de libertad del numerador:
muestras – 1 = 4 – 1 = 3
Grados de libertad del denominador:
Total global – tratamientos = 22 – 4 = 18
TACA
70
73
76
78
80
68
65
AA
68
70
72
65
74
65
𝑔𝑙 = 3
𝑔𝑙 = 18
. . . Ejemplo
› Regla de decisión
2 colas
𝛼 = 0.01
𝐹 = 5.09
𝑔𝑙 = 3
𝑔𝑙 = 18
› Toma de decisión
Media global
1664
𝑋𝑔 =
= 75.64
22
Media de tratamientos
Eastern
94
90
85
80
Eastern
87.3
TWA
75
68
77
83
88
TACA
70
73
76
78
80
68
65
Suma global =
TWA
78.2
TACA
72.9
AA
68
70
72
65
74
65
1664
AA
69.0
. . . Ejemplo
Variación Total
𝑉𝑡𝑜𝑡𝑎𝑙 = 1485.09
NOTA
Eastern
94
90
85
80
TWA
75
68
77
83
88
TACA
70
73
76
78
80
68
65
AA
68
70
72
65
74
65
Variación total :
𝑥𝑖 − 𝑋𝑔
2
337.09
206.21
87.61
19.01
0.41
58.37
1.85
54.17
152.77
31.81
6.97
0.13
5.57
19.01
58.37
113.21
58.37
31.81
13.25
113.21
2.69
113.21
1,485.09
Variación Tratamiento
𝑋𝑔 = 75.64
Eastern
87.3
TWA
78.2
Descripción
Media Tratamiento
Media global
Tamaño muestra
𝑛𝑖 𝑋𝑖 − 𝑋𝑔
2
TACA
72.9
AA
69.0
Eastern
87.3
75.64
4
TWA
78.2
75.64
5
TACA
72.9
75.64
7
AA
69.0
75.64
6
539
33
54
265
𝑉𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜 = 890.68
. . . Ejemplo
NOTA
Variación Aleatoria
Eastern
𝑋𝑔 = 75.64
TWA
Eastern
87.3
TWA
78.2
TACA
72.9
AA
69.0
TACA
𝑉𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎 = 594.4
AA
𝑋𝐼
94
87.3
90
87.3
85
87.3
80
87.3
75
78.2
68
78.2
77
78.2
83
78.2
88
78.2
70
72.9
73
72.9
76
72.9
78
72.9
80
72.9
68
72.9
65
72.9
68
69.0
70
69.0
72
69.0
65
69.0
74
69.0
65
69.0
Variación aleatoria
𝑥𝑖 − 𝑋𝑗
2
45.6
7.6
5.1
52.6
10.2
104.0
1.4
23.0
96.0
8.2
0.0
9.9
26.4
51.0
23.6
61.7
1.0
1.0
9.0
16.0
25.0
16.0
594.4
. . . Ejemplo
Varianza 1
𝑠𝑡2
𝑉𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜
890.68 890.68
=
=
=
= 296.9
𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠 − 1
4−1
3
Varianza 2
𝑠𝑎2
𝑉𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎
594.4
594
=
=
=
= 33.0
𝑡𝑎𝑚𝑎ñ𝑜 𝑔𝑙𝑜𝑏𝑎𝑙 − 𝑡𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠 22 − 4
18
Distribución F
296.9
𝐹=
= 8.99
33
𝐿𝑎 ℎ𝑖𝑝ó𝑡𝑒𝑠𝑖𝑠 𝑛𝑢𝑙𝑎 𝑛𝑜 𝑠𝑒 𝑎𝑐𝑒𝑝𝑡𝑎.
𝐸𝑥𝑖𝑠𝑡𝑒 𝑒𝑣𝑖𝑑𝑒𝑛𝑐𝑖𝑎 𝑠𝑖𝑔𝑛𝑖𝑓𝑖𝑐𝑎𝑡𝑖𝑣𝑎 𝑑𝑒 𝑞𝑢𝑒 𝑙𝑎𝑠 4 𝑚𝑢𝑒𝑠𝑡𝑟𝑎𝑠 𝑛𝑜
𝑠𝑜𝑛 𝑖𝑔𝑢𝑎𝑙𝑒𝑠
Tratamiento e inferencia
sobre pares de medias
poblacionales
Distribución t
Tratamiento e inferencia sobre pares de
medias poblacionales
› Análisis después de que una hipótesis ha sido rechazada
o no aceptada.
› Se tiene sospecha que solo algunas de las muestras
afectan el resultado
› Análisis sobre dos muestras a la vez
› Utilización de intervalos
› Error muestral calculado en base de la distribución
t
Intervalo de confianza sobre pares de medias
𝐼𝐶 = 𝑋1 − 𝑋2 ± 𝑡
𝑠𝑎2
1
1
+
𝑛1 𝑛2
𝑋1 ≡ 𝑀𝑒𝑑𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑝𝑟𝑖𝑚𝑒𝑟𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑒𝑙𝑒𝑔𝑖𝑑𝑎
𝑋2 ≡ 𝑀𝑒𝑑𝑖𝑎 𝑑𝑒 𝑙𝑎 𝑠𝑒𝑔𝑢𝑛𝑑𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑒𝑙𝑒𝑔𝑖𝑑𝑎
𝑡 ≡ 𝐸𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑜 𝑑𝑒 𝑝𝑟𝑢𝑒𝑏𝑎 𝑡
𝑠𝑎2 ≡ 𝑉𝑎𝑟𝑖𝑎𝑛𝑧𝑎 𝑑𝑒 𝑙𝑎 𝑣𝑎𝑟𝑖𝑎𝑐𝑖ó𝑛 𝑎𝑙𝑒𝑎𝑡𝑜𝑟𝑖𝑎
𝑛1 ≡ 𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑝𝑟𝑖𝑚𝑒𝑟𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑒𝑙𝑒𝑔𝑖𝑑𝑎
𝑛2 ≡ 𝑇𝑎𝑚𝑎ñ𝑜 𝑑𝑒 𝑙𝑎 𝑠𝑒𝑔𝑢𝑛𝑑𝑎 𝑚𝑢𝑒𝑠𝑡𝑟𝑎 𝑒𝑙𝑒𝑔𝑖𝑑𝑎
𝑔𝑙 = 𝑀𝑢𝑒𝑠𝑡𝑟𝑎 𝑔𝑙𝑜𝑏𝑎𝑙 − 𝑇𝑟𝑎𝑡𝑎𝑚𝑖𝑒𝑛𝑡𝑜𝑠
Ejemplo . . .
Metroya rechazó la hipótesis de que las 4 muestras son
iguales. Se va a hacer una revisión de la muestras de
Eastern y AA para determinar si los clientes de estas
empresas inciden en los resultados obtenidos. Calcular el
intervalo de confianza utilizando un nivel de confianza del
95%
𝑋1 = 87.3
𝑋2 = 69.0
𝑛𝑔 = 22
𝑡𝑟𝑎𝑡 = 4
𝑔𝑙 = 22 − 4 = 18
𝑛1 = 4
𝑛2 = 6
𝑡 = 2.101
𝛼 = 0.05
2 𝑐𝑜𝑙𝑎𝑠
. . . Ejemplo
𝑋1 = 87.3
𝑋2 = 69.0
𝑛1 = 4
𝑛2 = 6
𝑡 = 2.101
𝑠𝑎2 = 33.02
𝑋1 − 𝑋2 ± 𝑡
𝑠𝑎2
1
1
+
=
𝑛1 𝑛2
1 1
87.3 − 69.0 ± 2.101
+ =
4 6
18.3 ± 2.101(3.709)
𝐼𝐶95%
18.3 − 7.793 = 10.46
=
18.3 + 7.793 = 26.04
Ambas están al mismo lado de la curva. Con un 95% de
confianza las medias varían significativamente.
Lind, D.A., Marchal, W.G., Wathen, S.A. (15). (2012). Estadística
Aplicada a los Negocios y la Economía. México: McGrawHill
33