Analisis_de_Varianza - Raul Jimmy Alvarez Guale

Download Report

Transcript Analisis_de_Varianza - Raul Jimmy Alvarez Guale

Análisis de Varianza (ANOVA)
Ing. Raúl Alvarez Guale, MPC
Motivación
• En sesiones anteriores se ha visto prueba de
hipótesis referentes a dos medias
poblacionales.
• En base a muestras de dos poblaciones se
trataba de testear si las medias poblacionales
diferían:
– Ho:
u1 = u2
– HA:
u1 ≠ u2
Para un nivel de significancia dado.
12-2
Motivación
• En esta sesión se enfoca el caso de testear a
través de muestras, para un nivel de
significancia dado, si las medias de tres o más
poblaciones difieren:
– Ho:
– HA:
u1 = u2 = u3 =…..= un
Al menos dos de las medias poblacionales
difieren.
12-3
Ejemplo
Usted desea saber si tres
“clubs” de golf dan diferentes
distancias. Para esto selec-cione
al azar e independien-temente
cinco medidas de las pruebas de
cada club. ¿Hay alguna
diferencia en las distancias
medias al nivel de significancia
de 0.05?
12-4
Club 1
254
263
241
237
251
Club 2
234
218
235
227
216
Club 3
200
222
197
206
204
Objetivos
• Reconocer situaciones en las que se usa el análisis de varianza
(ANOVA).
• Entender diferentes diseños de análisis de varianza.
• Desarrollar ANOVA de un factor (manualmente y con la ayuda de
programas) e interpretar el resultado.
• Ejecutar e interpretar procesos de comparación por pares
(después del análisis de varianza).
• Desarrollar ANOVA de Bloques Completamente Aleatorizados.
• Desarrollar ANOVA de dos factores con réplicas a través de Excel
o SPSS.
12-5
Alcance
Análisis de Varianza (ANOVA)
ANOVA de
Un Factor
ANOVA de
Bloques Completamente Aleatorizados
ANOVA de
Dos Factores
(con réplicas)
Prueba F
Prueba F
Prueba
TukeyKramer
Prueba Fisher de
Mínima Diferencia
Significativa
12-6
Lógica del Análisis de Varianza
• El investigador controla una o más variables
independientes:
– Llamadas factores.
– Cada factor tiene dos o más niveles o tratamientos (o
categorías/ clasificaciones).
• Observar los efectos en la variable dependiente
– Repuesta a niveles de la variable independiente.
• Diseño experimental: Plan para probar hipótesis.
12-7
Propósito del Análisis de Varianza
• Supóngase que en un experimento agrícola
cuatro tratamientos químicos diferentes del
suelo producen rendimientos medios de trigo
de 28,22,18 y 24 hl/ha respectivamente. ¿Hay
una diferencia apreciable en estas medias o la
dispersión observada simplemente se debe al
azar?
Clasificación Simple o Experimentos de
un Factor
• En un experimento de un factor se obtienen
medidas u observaciones para z grupos
independientes de muestras, donde el
número de medidas en cada grupo es b.
• Hablamos de a tratamientos cada uno de los
cuales tiene b repeticiones o réplicas.
Clasificación Simple o Experimentos
de un Factor-Iguales número de
Observaciones
Diseño Completamente Aleatorizado
(Un Factor)
• Las unidades experimentales (sujetos) son
asignados al azar a los niveles del factor.
• Sólo hay un factor (variable independiente)
– Con dos o más niveles o tratamientos
• Analizado por
– Análisis de varianza de un factor (one-way ANOVA).
• Llamado Diseño Balanceado si todos los niveles
del factor tienen igual tamaño de muestra.
12-11
Análisis de Varianza de Un
Factor
• Evalúa la igualdad entre las medias de dos o más poblaciones
Ejemplos:
● Tasas de accidentes para el 1er, 2do y 3er turno
● Kilometrajes esperados
por galón para 5 marcas de
neumáticos
• Supuestos
– Las poblaciones tienen distribución normal
– Las poblaciones tienen igual varianza
– Las muestras son aleatorias e independientes
– La medida de los datos es de intervalo o razón
12-12
One-Way ANOVA: Hipótesis
• H0 : μ1  μ2  μ3    μk
– Todas las medias poblacionales son iguales
– Es decir, no hay efecto de tratamiento (no hay variación
entre las medias de los grupos)
•
H A : No todaslas medias poblacionales son iguales
– Al menos dos medias poblacionales son diferentes
– Es decir, hay efecto de tratamiento
– No significa que todas las medias poblacionales sean
diferentes (algunos pares podrían ser iguales)
12-13
ANOVA de Un Factor
H0 : μ1  μ 2  μ3    μ k
HA : No todaslas μ i son iguales
Todas las medias son iguales:
La hipótesis nula es verdadera
(No hay efecto de tratamiento)
μ1  μ2  μ3
12-14
ANOVA de Un Factor
H0 : μ1  μ 2  μ3    μ k
(continuación)
HA : No todaslas μ i son iguales
Al menos dos medias son diferentes:
La hipótesis nula no es verdadera
(Hay efecto de tratamiento)
o
μ1  μ2  μ3
μ1  μ2  μ3
12-15
ANOVA de Un Factor
• Supuestos
– Las poblaciones tienen distribución normal
– Las poblaciones tienen igual varianza
– Las muestras son aleatorias e independientes
– La medida de los datos es de intervalo o razón
• Supuesto Normalidad.pdf
• Supuesto Varianzas.pdf
12-16
ANOVA de Un Factor
Supuestos:
• Si las muestras son del mismo tamaño, los procedimientos
ANOVA son robustos, esto es las pruebas no se ven
mayormente afectadas si los supuestos de normalidad e igual
varianza no se cumplen.
• Si las muestras no son del mismo tamaño, los procedimientos
ANOVA aún son relativamente robustos si el ratio entre la
muestra de mayor tamaño y la de menor tamaño no excede
1.5.
12-17
Diseños ANOVA
Desagregar la variación total de los datos en
términos de:
• Las variaciones explicadas por los
tratamientos o niveles.
• Las variaciones aleatorias al interior de cada
tratamiento o nivel.
12-18
Fórmulas
• Los resultados de un experimento de un factor
pueden representarse en una tabla con a filas
y b columnas. Aquí 𝒙𝒋𝒌 denota la medida en
una fila j y la columna k, donde j=1,2,…,a;
k=1,2,3,…,b
1
𝑥=
𝑎𝑏
𝒙𝒋𝒌
𝑗,𝑘
1
=
𝑎𝑏
𝑎
𝑏
𝒙𝒋𝒌
𝑗=1 𝑘=1
Tabla de Observaciones-Un factor
Tratamiento 1
𝒙𝟏𝟏
𝒙𝟏𝟐
...
𝒙𝟏𝒃
𝒙𝟏.
Tratamiento 2
𝒙𝟐𝟏
𝒙𝟐𝟐
...
𝒙𝟐𝒃
𝒙𝟐.
𝒙𝒂𝟏
𝒙𝒂𝟐
...
𝒙𝒂𝒃
𝒙𝒂.
.
.
.
Tratamiento a
Se denota como
1
𝑥𝑗. =
𝑏
𝑏
𝑥𝑗𝑘
𝑘=1
𝑗 = 1,2, … , 𝑎
Desagregando la Variación
Total
• La variación total puede ser desagregada en dos partes:
SST = SSB + SSW
SST o 𝜐 = Suma Total de Cuadrados (variación total).
SSB o 𝜐𝜔 = Suma de Cuadrados entre Tratamientos
(variación entre niveles del factor).
SSW o 𝜐𝑏 = Suma de Cuadrados del Error (variación dentro
de los niveles del factor).
12-21
Variación Total
• Se define como variación Total, denotado por
𝜐(Ipsilon/Upsilon), como la suma de los
cuadrados de las desviaciones de cada medida
de la gran media 𝑥, es decir:
(𝒙𝒋𝒌 −𝑥)𝟐
𝜐=
𝑗,𝑘
Variación dentro de Tratamientos
• Esta variación incluye los cuadrados de las
desviaciones de 𝒙𝒋𝒌 con respecto a las medias
de tratamiento 𝒙𝒋. Se de nota como 𝜐𝜔 .
(𝒙𝒋𝒌 −𝒙𝒋. )𝟐
𝜐𝜔 =
𝑗,𝑘
Variación entre Tratamientos
• Esta variación incluye los cuadrados de las
desviaciones de las diferentes medias de
tratamiento 𝒙𝒋. de la gran media 𝒙 Se de nota
como 𝜐𝑏 .
(𝒙𝒋. − 𝑥)𝟐 = 𝑏
𝜐𝑏 =
𝑗,𝑘
(𝒙𝒋. − 𝑥)𝟐
𝑘
• Variación Total = Variación dentro de
tratamientos + Variación entre tratamientos
𝜐 = 𝜐𝜔 + 𝜐𝑏
Desagregando la Variación
Total
(continuación)
Variación Total (SST)
=
Variación Debido
al Factor (SSB)
+
Referida comúnmente como:
 S.C. entre Niveles del Factor
 S.C. Explicada
 Variación Entre Grupos
Variación Debido al
Muestreo Aleatorio (SSW)




12-26
Referida comúnmente como:
S.C. dentro de cada Nivel del
Factor
S.C. del Error
S.C. no Explicada
Variación dentro de Grupos
Desagregando la Variación
Total
(continuación)
SST = SSB + SSW
𝜐 = 𝜐𝜔 + 𝜐𝑏
Variación Total (SST) = Dispersión total de los valores
individuales.
Variación entre niveles del factor (SSB) = Dispersión
entre las medias muestrales del factor.
Variación dentro de los niveles del factor (SSW) = Dispersión que existe entre los datos al interior de cada nivel
del factor.
12-27
Variación Total (SST)
SST = SSB + SSW
k
ni
SST   ( xij  x )2
i1 j1
Donde:
SST = Suma total de cuadrados
k = Número de poblaciones (niveles)
ni = Tamaño muestral de la población i.
xij = jma medida de la muestra correspondiente a la
población i.
x = Gran media (media de todos los datos)
12-28
Variación Total (SST)
(continuación)
SST  (x11  x)  (x12  x)  ...  (xknk  x)
2
2
12-29
2
Variación entre Niveles del Factor
(SSB)
SST = SSB + SSW
k
SSB   ni ( x i  x )
2
i1
Donde:
SSB = Suma de cuadrados entre tratamientos
k = Número de poblaciones (niveles)
ni = Tamaño muestral de la población i.
xi = Media muestral de la población i.
x = Gran media (media de todos los datos)
12-30
Variación entre Niveles del Factor
(SSB)
(continuación)
k
SSB   ni ( x i  x )
2
i1
Variación Debido a Diferencias
entre las Poblaciones
SSB
MSB 
k 1
Media CuaSSB
drática entre =
Grados de libertad
Tratamientos
i
j
12-31
Variación entre Niveles del Factor
(SSB)
(continuación)
SSB  n1( x1  x)  n2 ( x 2  x)  ...  nk ( xk  x)
2
2
12-32
2
Variación dentro de los Niveles del
Factor (SSW)
SST = SSB + SSW
k
SSW  
i 1
ni

j 1
( xij  xi ) 2
Donde:
SSW = Suma de cuadrados del error
k = Número de poblaciones
ni = Tamaño de la muestra de la población i
xi = Media muestral de la población i
xij = jma medida de la muestra correspondiente
a la población i.
12-33
Variación dentro de los Niveles del
Factor (SSW)
(continuación)
k
SSW  
i1
nj

j1
( xij  xi )2
SSW
MSW 
nT  k
Calculando la variación
dentro de cada grupo y
luego sumando todas
estas
Media
Cuadrática =
del Error
i
12-34
SSW
Grados de libertad
Variación dentro de los Niveles del
Factor (SSW)
(continuación)
SSW  ( x11  x1 )  ( x12  x1 )  ... ( xknk  xk )
2
2
12-35
2
ANOVA de Un Factor: Estadístico de
prueba F
H0: μ1= μ2 = … = μ k
HA: Al menos dos medias poblacionales son diferentes
• Estadístico de prueba:
MSB
F
MSW
MSB: Media cuadrática entre tratamientos
MSW: Media cuadrática dentro de tratamientos
• Grados de libertad
– glnumerador = k – 1 (k = Número de poblaciones)
– gldenominador = nT – k (nT = Suma de todos los tamaños de muestra)
12-36
ANOVA de Un Factor: Interpretación
del estadístico F
• El estadístico F es la razón de la media cuadrática
entre tratamientos y la media cuadrátrica dentro
de tratamientos
– La razón siempre debe ser positiva
– glnumerador = k -1, comúnmente será pequeño
– gldenominador = nT – k, comúnmente será grande
La razón debería estar cerca a 1 si
H0: μ1= μ2 = … = μk es verdadera
La razón debería ser más grande que 1 si
H0: μ1= μ2 = … = μk es falsa
12-37
ANOVA de Un Factor: Ejemplo
(Solución
H0: μ1 = μ2 = μ3; HA: Al menos dos son diferentes
 = 0.05
F0.05 (Valor crítico)
glnumerador
 = 0.05
gldenominador
0
No rechazar H0
Rechazar H0
Estadístico de prueba:
F
Decisión:
MSB
MSW
Rechazar H0 para  = 0.05
Conclusión:
Hay suficiente evidencia para concluir que al menos dos medias
son diferentes/Iguales 12-38
ANOVA: Pasos
1.
2.
3.
4.
5.
6.
7.
8.
Especificar el parámetro de interés.
Formular hipótesis.
Fijar el nivel de significancia, .
Seleccionar muestras aleatorias e independientes
• Calcular las medias muestrales y la gran media.
Determinar la regla de decisión.
Verificar los supuestos: Normalidad e igualdad de
varianzas.
Crear la tabla ANOVA.
Tomar una decisión e interpretar resultados.
12-39
Métodos cortos para obtener
variaciones
𝜏 (𝑇𝑎𝑢)
𝜏=
𝒙𝒋𝒌
𝜏𝑗. =
𝑗,𝑘
𝜐=
𝒙𝒋𝒌 𝟐
𝑗,𝑘
𝒙𝒋𝒌
𝑘
𝜏2
−
𝑎𝑏
1
𝜐𝑏 =
𝑏
𝜐𝜔 = 𝜐 − 𝜐𝑏
𝑗
2
𝜏
𝜏𝒋. 𝟐 −
𝑎𝑏
Fórmulas cortas
Tratamiento 1
Tratamiento 2
𝒙𝟏𝟏
𝒙𝟐𝟏
𝒙𝟏𝟐
𝒙𝟐𝟐
...
...
𝒙𝟏𝒃
𝝉𝒋.
𝝉𝒋. 2
𝑏
𝜏1. 2
𝜏1. =
𝒙𝟏𝒌
𝑘=1
𝑏
𝒙𝟐𝒃
𝜏2. =
𝒙𝟐𝒌
𝜏2. 2
𝑘=1
.
.
.
Tratamiento a
𝒙𝒂𝟏
𝒙𝒂𝟐
...
𝑏
𝒙𝒂𝒃
𝜏𝑎. =
𝒙𝒂𝒌
𝜏𝑎. 2
𝑘=1
𝒙𝒋𝒌 𝟐
𝜏=
𝑗,𝑘
𝜐=
𝒙𝒋𝒌 𝟐
𝑗,𝑘
𝜏2
−
𝑎𝑏
𝜏𝑗.
𝑗
1
𝜐𝑏 =
𝑏
𝑗
2
𝜏
𝜏𝒋. 𝟐 −
𝑎𝑏
𝜏𝒋. 𝟐
𝑗
Tablas de Análisis de varianza
Variación
Grados de Libertad
Entre Tratamientos
𝜐𝑏
a-1
Media de
Cuadrados
𝜐𝑏
𝟐
𝒔𝒃 =
𝑎−1
(𝒙𝒋. − 𝑥)𝟐
=𝑏
𝑘
. Dentro de
tratamientos,
𝜐𝜔 = 𝜐 − 𝜐𝑏
a(b-1)
Total
𝜐 = 𝜐𝜔 + 𝜐𝑏
ab-1
(𝒙𝒋𝒌 −𝑥)𝟐
𝜐=
𝑗,𝑘
𝒔𝟐 =
𝜐𝜔
𝑎(𝑏 − 1)
F
𝑭 =
𝒔𝒃 𝟐
𝒔𝟐
Con a-1, a(b-1)
grados de libertad
Problema 1
• La tabla siguiente muestra los rendimientos en
hl/ha de una cierta variedad de trigo cultivado
en un tipo particular de suelo tratado con
Químicos A,B o C. Hallar a) El rendimiento
medio para los diferentes tratamientos, b) La
gran media para todos los tratamientos, c) la
variación total, d) la variación entre
tratamientos, e) la variación dentro de
tratamientos.
Problema 1
f) Hallar la estima insesgada de la varianza
poblacional 𝜎 2 de la variación entre
tratamientos bajo la hipótesis nula de igual
medias de tratamiento, g) la estima insesgada
de la varianza poblacional de la variación dentro
de tratamientos h) Podemos rechazar la
hipótesis nula de medias uguales a nivel de
significación del 0.05 e i) 0.01
Datos del Problema 1
A
48
49
50
49
B
47
49
48
48
C
49
51
50
50
Solución
Tabla Original
A
48
49
50
49
B
47
49
48
48
C
49
51
50
50
Tabla modificada (Restando 45)
A
3
4
5
4
B
2
4
3
3
C
4
6
5
5
a) Media de tratamientos
𝒙𝟏. =
𝟏
𝟒
𝟑+𝟒+𝟓+𝟒 =𝟒
𝒙𝟑. =
𝟏
𝟒
𝟒+𝟔+𝟓+𝟓 =𝟓
𝟏
𝒙𝟐. = 𝟐 + 𝟒 + 𝟑 + 𝟑 = 𝟑
𝟒
Tabla modificada (Restando 45)
A
3
4
5
5
4
B
2
4
3
3
3
C
4
6
5
5
5
• Por lo tanto son 49, 48 y 50 hl/ha para A,B y C
(sumando 45 a cada resultado)
b) La gran media
𝟏
𝒙=
𝟑+𝟒+𝟓+𝟒+𝟐+𝟒+𝟑+𝟑+𝟒+𝟔+𝟓+𝟓 =𝟒
𝟏𝟐
• Así la gran media para el conjunto original de
datos es 45+4 = 49 hl/ha
c) Variación Total
(𝒙𝒋𝒌 −𝑥)𝟐
𝜐=
𝑗,𝑘
𝝊
= (𝟑 − 𝟒)𝟐 + (𝟒 − 𝟒)𝟐 + (𝟓 − 𝟒)𝟐 + (𝟒 − 𝟒)𝟐
+ (𝟐
− 𝟒)𝟐 + (𝟒 − 𝟒)𝟐 + (𝟑 − 𝟒)𝟐 + (𝟑 − 𝟒)𝟐 + (𝟒 − 𝟒)𝟐 + (𝟔
− 𝟒)𝟐 + (𝟓 − 𝟒)𝟐 + (𝟓 − 𝟒)𝟐 = 𝟏𝟒
d) Variación entre tratamientos
(𝒙𝒋. − 𝑥)𝟐 = 𝑏
𝝊𝒃 =
𝑗,𝑘
(𝒙𝒋. − 𝑥)𝟐
𝑘
𝝊𝒃 =
4( (𝟒 − 𝟒)𝟐 + (𝟑 − 𝟒)𝟐 + 𝟓 − 𝟒)𝟐 = 𝟖
e) Variación dentro de tratamientos
𝜐𝜔 =
(𝒙𝒋. −𝒙𝒋. )𝟐
𝑗,𝑘
𝟒)𝟐 +
• 𝜐𝜔 = (𝟑 − 𝟒)𝟐 + (𝟒 −
(𝟓 − 𝟒)𝟐 + (𝟒 − 𝟒)𝟐 +
(𝟐 − 𝟑)𝟐 + (𝟒 − 𝟑)𝟐 + (𝟑 − 𝟑)𝟐 + (𝟑 − 𝟑)𝟐 +
(𝟒 − 𝟓)𝟐 + (𝟔 − 𝟓)𝟐 + (𝟓 − 𝟓)𝟐 + (𝟓 − 𝟓)𝟐 = 𝟔
f)Y g) Estima insesgada de la varianza
entre/dentro tratamiento
𝜐
8
𝑏
𝒔𝒃 𝟐 =
=
=4
𝑎−1 3−1
𝜐
6
2
𝜔
𝒔𝟐 =
=
=
𝑎(𝑏 − 1) 3(4 − 1) 3
h) Prueba de hipótesis 0.05
𝟐
𝟒
𝒔
𝒃 =
=
= 𝟔
𝑭
/
𝒔𝟐 𝟐 𝟑
Con
𝒂−𝟏=𝟑−𝟏=𝟐
𝒂 𝒃−𝟏 =𝟑 𝟒−𝟏 =𝟗
Según la tabla F, 𝜈1 = 2 𝑦 𝜈2 = 9, se nota que
𝐹0.95 = 4.26 Puesto que F=6>𝐹0.95 se puede
rechazar la hipótesis nula de medias iguales al
nivel de 0.05
i) Prueba de hipótesis 0.01
𝟐
𝟒
𝒔
𝒃 =
=
= 𝟔
𝑭
/
𝒔𝟐 𝟐 𝟑
Con
𝒂−𝟏=𝟑−𝟏=𝟐
𝒂 𝒃−𝟏 =𝟑 𝟒−𝟏 =𝟗
Según la tabla F, 𝜈1 = 2 𝑦 𝜈2 = 9, se nota que
𝐹0.99 = 8.02 Puesto que F=6>𝐹0.99 No se puede
rechazar la hipótesis nula de medias iguales al
nivel de 0.01
Resumen del Problema 1
Variación
Grados de Libertad
Entre Tratamientos
𝜐𝑏 = 8
a-1=2
. Dentro de
tratamientos,
𝜐𝜔 = 𝜐 − 𝜐𝑏
𝜐𝜔 = 14 − 8 = 6
Total
𝜐 = 𝜐𝜔 + 𝜐𝑏
𝜐 = 14
a(b-1)=(3)(3)=9
ab-1=(3)(4)-1=11
Media de
Cuadrados
𝜐𝑏
8
𝟐
𝒔𝒃 =
=
𝑎−1 2
=4
𝜐𝜔
6
𝒔𝟐 =
=
𝑎(𝑏 − 1) 9
2
=
3
F
𝑭 =
𝑭 =
𝒔𝒃 𝟐
𝒔𝟐
𝟒
= 𝟔
𝟐/𝟑
Con (2, 9) grados de
libertad
Resolver el problema 1, utilizando
Métodos cortos para obtener
variaciones
𝜏 (𝑇𝑎𝑢)
𝜏=
𝒙𝒋𝒌
𝜏𝑗. =
𝑗,𝑘
𝜐=
𝒙𝒋𝒌 𝟐
𝑗,𝑘
𝒙𝒋𝒌
𝑘
𝜏2
−
𝑎𝑏
1
𝜐𝑏 =
𝑏
𝜐𝜔 = 𝜐 − 𝜐𝑏
𝑗
2
𝜏
𝜏𝒋. 𝟐 −
𝑎𝑏
las fórmulas cortas
𝝉=𝟑+𝟒+𝟓+𝟒+𝟐+𝟒+𝟑+𝟑+
𝟒 + 𝟔 + 𝟓 + 𝟓 = 𝟒𝟖
𝒙𝒋𝒌 𝟐 =
𝑗,𝑘
𝟗 + 𝟏𝟔 + 𝟐𝟓 + 𝟏𝟔 +
𝟒 + 𝟏𝟔 + 𝟗 + 𝟗 +
𝟏𝟔 + 𝟑𝟔 + 𝟐𝟓 + 𝟐𝟓 = 𝟐𝟎𝟔
c) Variación Total
𝝊=
𝒙𝒋𝒌 𝟐
𝑗,𝑘
𝜏2
(48)2
−
= 206 −
= 𝟏𝟒
𝑎𝑏
(3)(4)
𝜏1. = 3 + 4 + 5 + 4 = 16
𝜏2. = 2 + 4 + 3 + 3 = 12
𝜏3. = 4 + 6 + 5 + 5 = 20
𝜏 = 16 + 12 + 20 = 48
Variación entre y dentro de
tratamiento
𝜐𝑏 =
𝑗
2
𝜏
𝜏𝒋. 𝟐 −
=
𝑎𝑏
2
1
(48)
𝜐𝑏 = 162 + 122 + 202 −
4
(3)(4)
𝜐𝑏 = 200 − 192 = 8
𝜐𝜔 = 𝜐 − 𝜐𝑏 = 14 − 8 = 6
Resumen Problema 2
𝝉𝒋.
𝝉𝒋. 2
A
B
3
2
4
4
5
3
4
3
16
12
256
144
C
4
6
5
5
20
400
𝒙𝒋𝒌 𝟐 = 206
𝜏=
𝑗,𝑘
𝜏𝑗. = 𝟒𝟖
𝑗
𝜐=
𝒙𝒋𝒌 𝟐
𝑗,𝑘
𝜏2
−
𝑎𝑏
𝜏𝒋. 𝟐 = 800
𝑗
1
𝜐𝑏 =
𝑏
𝑗
2
𝜏
𝜏𝒋. 𝟐 −
𝑎𝑏
Problema 3
• Una compañía desea comprar una de cinco
máquinas diferentes A,B,C,D,E. En un
experimento diseñado para decidir si hay
diferencia en el rendimiento de las máquinas,
cinco operadores experimentados trabajan
con las máquinas durante intervalos iguales.
La siguiente tabla muestra el número de
unidades producidas. Ensayar la hipótesis de
Problema 3
significación del a) 0.05 y b)0.01
A
68
72
75
42
53
B
72
52
63
55
48
C
60
82
65
77
75
D
48
61
57
64
50
E
64
65
70
68
53
Solución: Problema 3
Se resta de cada elemento de la matriz un valor
apropiado, por ejemplo: 60
𝝉𝒋.
𝝉𝒋. 2
A
8
12 15 -18 -7
B
12
-8
3
-5
-2
C
0
22 6
17
15
D
-12 1
-3
4
-10
E
4
10 8
5
𝒙𝒋𝒌 𝟐 =
𝑗,𝑘
2
2
2
2
2
-7
𝜏=
𝜏𝑗. =
𝑗
𝜏𝒋. 𝟐 =
𝑗
Cálculos del Problema 3
𝝉𝒋.
𝝉𝒋. 2
A 8
12 15 -18 -7
10
100
B 12
-8
3
-5
-2
0
0
C 0
22 6
17
15
60
3600
4
-10
-20
400
-7
20
400
D -12 1
-3
E 4
10 8
5
𝒙𝒋𝒌 𝟐 = 2356
𝜏=
𝑗,𝑘
𝜏𝑗. = 𝟕𝟎
𝑗
𝜐=
𝒙𝒋𝒌 𝟐
𝑗,𝑘
𝜏2
−
𝑎𝑏
𝜏𝒋. 𝟐 = 4500
𝑗
1
𝜐𝑏 =
𝑏
𝑗
2
𝜏
𝜏𝒋. 𝟐 −
𝑎𝑏
Variaciones Totales
• Se obtienen las variaciones totales, entre y
dentro de cada tratamiento
𝝊=
𝒙𝒋𝒌 𝟐
𝑗,𝑘
1
𝝊𝒃 =
𝑏
𝑗,𝑘
𝜏2
702
−
= 2356 −
= 𝟐𝟏𝟏𝟏
𝑎𝑏
5 4
2
2
𝜏
1
70
𝜏𝒋. 2 −
= 4500 −
= 𝟔𝟓𝟓
𝑎𝑏 5
5 4
𝝊𝝎 = 𝜐 − 𝜐𝑏 = 2111 − 655 = 𝟏𝟒𝟓𝟔
Resumen del Problema 3
Variación
Grados de Libertad
Entre Tratamientos
𝜐𝑏 = 655
a-1=4
. Dentro de
tratamientos,
𝜐𝜔 = 𝜐 − 𝜐𝑏
𝜐𝜔 = 1456
a(b-1)=(5)(4)=20
Total
𝜐 = 𝜐𝜔 + 𝜐𝑏
𝜐 = 2111
ab-1=(5)(4)-1=24
Media de
Cuadrados
F
𝒔𝒃 𝟐
𝜐
655
=
𝑏
𝑭
𝒔𝒃 𝟐 =
=
𝒔𝟐
𝑎−1
4
= 163,75
163,75
𝜐𝜔
𝟐
𝐹
=
= 2,25
𝒔 =
72,8
𝑎(𝑏 − 1)
Con (4, 20) grados
1456
=
= 72,8 de libertad
(5)(4)
Conclusión: Problema 3
• Para (4,20) grados de libertad se tiene 𝐹0,95 =
2,87. Por lo tanto no se puede rechazar la
hipótesis nula a un nivel de 0,05, lógicamente
tampoco se puede rechazar al nivel de 0,01
Clasificación Simple o Experimentos
de un Factor-Diferentes número de
Observaciones
Fórmulas
• Los resultados de un experimento de un factor
pueden representarse en una tabla con a filas
y nk columnas. Aquí 𝒙𝒋𝒌 denota la medida en
una fila j y la columna k, donde j=1,2,…,a;
k=1,2,3,…, nk
1
𝑥=
𝑛
.
𝑛𝑗 (𝑥1. − 𝑥)2
𝜐𝑏 =
𝒙𝒋𝒌
𝑗
𝑗,𝑘
(𝑥𝑗𝑘 − 𝑥)2
𝜐=
𝑗,𝑘
Fórmulas cortas
𝝉𝒋.
Tratamiento 1
Tratamiento 2
𝒙𝟏𝟏
𝒙𝟐𝟏
𝒙𝟏𝟐
𝒙𝟐𝟐
...
...
𝒙𝟏𝒏𝟏
𝒙𝟐𝒏𝟐
𝝉𝒋. 2
𝑛1
𝜏1. =
𝒙𝟏𝒌
𝑘=1
𝑛2
𝜏2. =
𝒙𝟐𝒌
𝜏1. 2
𝜏2. 2
𝑘=1
.
.
.
Tratamiento a
𝒙𝒂𝟏
𝒙𝒂𝟐
...
𝒙𝒂𝒏𝒂
𝑛𝑎
𝜏𝑎. =
𝒙𝒂𝒌
𝜏𝑎. 2
𝑘=1
𝒙𝒋𝒌
𝜏=
𝟐
𝑗,𝑘
𝑗
𝑎
𝑛=
𝑛𝑗
𝑗
𝜏𝑗.
𝜐=
𝒙𝒋𝒌 𝟐
𝑗,𝑘
𝜏2
−
𝑛
𝜐𝑏 =
𝑗
𝑗
𝜏𝒋. 𝟐 𝜏 2
−
𝑛𝑗
𝑛
𝜏𝒋. 𝟐
𝑛𝑗
Tabla de Análisis de Varianza
Variación
Entre Tratamientos
.
Grados de
Libertad
a-1
𝑛𝑗 (𝑥1. − 𝑥)2
𝜐𝑏 =
Media de
Cuadrados
𝜐𝑏
𝟐
𝒔𝒃 =
𝑎−1
𝑗
. Dentro de
tratamientos,
𝜐𝜔 = 𝜐 − 𝜐𝑏
n-a
Total
n-1
𝜐 = 𝜐𝜔 + 𝜐𝑏
(𝑥𝑗𝑘 − 𝑥)2
𝜐=
𝑗,𝑘
𝒔𝟐 =
𝜐𝜔
𝑛−𝑎
F
𝑭 =
𝒔𝒃 𝟐
𝒔𝟐
Con (a-1, n-a)
grados de libertad
Problema 4
• La siguiente tabla muestra la duración en
horas de las muestras de tres tipos diferentes
de tubos de televisión fabricados por una
compañía. Utilizando el método corto, ensayar
al nivel de significación del (a)0.05, (b) 0.01 si
hay diferencia en los tres tipos.
Muestras
Muestra 1
407
411
409
Muestra 2
404
406
408
405
Muestra 3
410
408
406
408
402
Cálculos cortos
Muestra 1
7
Muestra 2
4
Muestra 3
10
11
6
8
9
𝝉𝒋.
𝝉𝒋. 2
3
𝜏1. 2
𝜏1. =
8
5
6
2
𝒙𝟏𝒌
𝑘=1
5
𝜏2. =
𝜏2. 2
𝒙𝟐𝒌
𝑘=1
4
8
𝜏𝑎. =
𝜏𝑎. 2
𝒙𝒂𝒌
𝑘=1
𝒙𝒋𝒌 𝟐
𝜏=
𝑗,𝑘
𝑛𝑗
𝑗
𝜏𝒋. 𝟐
𝑗
𝑎
𝑛=
𝜏𝑗.
𝜐=
𝒙𝒋𝒌 𝟐
𝑗,𝑘
𝜏2
−
𝑛
𝑗
𝜐𝑏 =
𝑗
𝜏𝒋. 𝟐 𝜏 2
−
𝑛𝑗
𝑛
Cálculos cortos
Muestra 1
7
11
9
Muestra 2
4
6
8
5
Muestra 3
10
8
6
8
2
𝒙𝒋𝒌 𝟐 = 𝟔𝟔𝟎
𝝉=
𝑗,𝑘
𝝉𝒋.
𝝉𝒋. 2
27
729
25
625
32
1024
𝜏𝑗. = 𝟖𝟒
𝑗
𝜏𝒋. 𝟐 = 𝟐𝟑𝟕𝟖
𝑗
𝑎
𝒏=
𝑛𝑗 = 3 + 5 + 4 = 𝟏𝟐
𝑗
𝝊=
𝒙𝒋𝒌 𝟐
𝑗,𝑘
𝝊𝒃 =
𝑗,𝑘
𝜏2
842
− = 660 −
= 𝟕𝟐
𝑛
12
𝜏𝒋. 𝟐 𝜏 2 272 25 32 842
− =
+
+
−
= 𝟑𝟔
𝑛𝑗
𝑛
3
5
4
12
𝝊𝝎 = 𝜐 − 𝜐𝑏 = 72 − 36 = 𝟑𝟔
Resumen del Problema 4
Variación
Grados de Libertad
Entre Tratamientos
𝜐𝑏 = 36
a-1=3-1=2
. Dentro de
tratamientos,
𝜐𝜔 = 𝜐 − 𝜐𝑏
𝜐𝜔 = 36
n-a=12-3=9
Total
𝜐 = 𝜐𝜔 + 𝜐𝑏
𝜐 = 72
Media de
Cuadrados
𝜐𝑏
36
𝟐
𝒔𝒃 =
=
𝑎−1
2
= 18
𝜐𝜔
36
𝒔𝟐 =
=
𝑛−𝑎
9
=4
F
𝑭 =
𝒔𝒃 𝟐
𝒔𝟐
18
= 4.5
4
Con (2, 9) grados de
libertad
𝐹=
Clasificación Simple o Experimentos
de dos Factores
¿Cuándo utilizar?
• Las ideas de análisis de varianza para
clasificación simple o experimentos de un
factor pueden generalizarse. Para la
clasificación doble o experimentos de dos
factores se ilustra por medio del siguiente
ejemplo:
Ejemplo
• Supóngase que en un experimento agrícola
consiste en examinar los rendimientos por
acre de 4 variedades diferentes de trigo
(tratamiento), donde cada variedad se cultiva
en 5 parcelas diferentes (bloques). En este
caso hay dos clasificaciones o factores, puesto
que puede existir diferencias en rendimiento
por tratamiento o bloques
Tabla de Observaciones-Dos factores
BLOQUES
T
R
A
T
A
M
1
2
...
b
1
𝒙𝟏𝟏
𝒙𝟏𝟐
...
𝒙𝟏𝒃
𝒙𝟏.
2
𝒙𝟐𝟏
𝒙𝟐𝟐
...
𝒙𝟐𝒃
𝒙𝟐.
𝒙𝒂𝟏
𝒙𝒂𝟐
...
𝒙𝒂𝒃
𝒙𝒂.
𝒙.𝟏
𝒙.𝟐
...
𝒙.𝒃
.
.
.
a
Se denota como
1
𝑥𝑗. =
𝑏
𝑏
𝑥𝑗𝑘
𝑘=1
𝑗 = 1,2, … , 𝑎
1
𝑥=
𝑎𝑏
1
𝑥.𝑘 =
𝑎
𝑎,𝑏
𝑥𝑗𝑘
𝑗,𝑘
𝑎
𝑥𝑗𝑘
𝑘=1
𝑘 = 1,2, … , 𝑏
Fórmulas cortas
T
R
A
T
A
M
I
E
N
T
O
S
1
1
2
...
b
𝒙𝟏𝟏
𝒙𝟏𝟐
...
𝒙𝟏𝒃
𝒙𝟐𝟏
2
𝒙𝟐𝟐
...
𝝉𝒋.
𝝉𝒋. 2
𝑛1
𝜏1. 2
𝜏1. =
𝒙𝟏𝒌
𝑘=1
𝑛2
𝒙𝟐𝒃
𝜏2. =
𝒙𝟐𝒌
𝜏2. 2
𝑘=1
.
𝒙𝒂𝟏
a
𝒙𝒂𝟐
...
𝑛𝑎
𝒙𝒂𝒃
𝜏𝑎. =
𝒙𝒂𝒌
𝜏𝑎. 2
𝑘=1
𝒙𝒋𝒌
𝟐
𝑗,𝑘
𝑛1
𝜏.1 =
𝑛2
𝒙.𝟏
𝜏.2 =
𝑘=1
𝒙.𝟐
...
𝑘=1
𝜏.1 2
𝜏.2 2
𝑛𝑏
𝜏.𝑏 =
𝜏=
𝒙.𝒃
𝑗
𝑘=1
...
𝜏𝑗.
𝜏.𝑏 2
𝜏𝒋. 𝟐
𝑗
𝜏.𝒌 𝟐
𝑗
𝜐=
𝒙𝒋𝒌
𝑗,𝑘
𝟐
𝜏2
−
𝑎𝑏
1
𝜐𝑟 =
𝑏
𝑎
𝜏𝒋. 2 −
𝑗=1
𝜏2
𝑛
1
𝜐𝑐 =
𝑎
𝑏
𝑘=1
2
𝜏
𝜏.𝒌 2 −
𝑛
𝜐 = 𝜐𝑟 + 𝜐𝑐 + 𝜐𝑒
Donde
𝜐 = variación Total
𝜐𝑟 = Variación entre filas (tratamientos)
𝜐𝑐 =Variación entre columnas (bloques)
𝜐𝑒 =Variación debido al error o al azar
Tabla de Análisis de Varianza
Variación
Entre Tratamientos
.
Grados de
Libertad
Media de Cuadrados
F
a-1
𝜐r
𝒔r 𝟐 =
𝑎−1
b-1
𝒔𝑐
𝒔𝑟 𝟐
𝒔𝑒 𝟐
Con (a-1),(a-1)(b-1)
grados de libertad
𝒔𝑐 𝟐
=
𝑭
𝒔𝑒 𝟐
Con (b-1),(a-1)(b-1)
grados de libertad
(𝑥𝑗. − 𝑥)2
𝜐𝑟 = 𝑏
𝑗
Entre Bloques
.
𝑛𝑗 (𝑥.𝑘 − 𝑥)2
𝜐𝑐 = 𝑎
𝟐
𝜐𝑐
=
𝑏−1
𝑘
Residual o aleatoria
𝜐𝑒 = 𝜐 − 𝜐𝑟 − 𝜐𝑐
(a-1)(b-1)
Total
𝜐 = 𝜐𝑟 + 𝜐𝑐 + 𝜐𝑒
ab-1
(𝑥𝑗𝑘 − 𝑥)2
𝜐=
𝑗,𝑘
𝒔𝑒 𝟐 =
𝜐𝑒
(𝑎 − 1)(𝑏 − 1)
𝑭 =
Problema 5
La siguiente tabla muestra los rendimientos por
acre de cuatro cosechas de plantas diferentes
cultivadas en parcelas tratadas con tres tipos
diferentes de fertilizantes. Utilizando el método
corto, ensayar el nivel de significación de 0,01 si
(a) hay una diferencia significativa en
rendimiento por acre debida a los fertilizantes,
(b) hay una diferencia significativa en
rendimiento por acre debido a las cosechas.
Tabla: Problema 5
Cosecha I Cosecha II
Cosecha III
Cosecha IV
Fertilizante A
4.5
6.4
7.2
6.7
Fertilizante B
8.8
7.8
9.6
7.0
Fertilizante C
5.9
6.8
5.7
5.2
𝝉𝒋.
𝝉𝒋. 2
1
2
3
4
Fertilizante A
4.5
6.4
7.2
6.7
24.8
615.04
Fertilizante B
8.8
7.8
9.6
7.0
33.2
1102.24
Fertilizante C
5.9
6.8
5.7
5.2
23.6
556.96
𝒙𝒋𝒌 𝟐 = 577,96
19.2
21.0
22.5
18.9
𝝉=81.6
𝜏𝒋. 𝟐
𝑗
𝑗,𝑘
= 2274.24
368.64
441
506.25
357.21
𝜏.𝒋 𝟐
𝑗
=1673,1
𝜐=
1
𝜐𝑟 =
𝑏
1
𝜐𝑐 =
𝑎
𝟓𝟕𝟕. 𝟗𝟔 −
𝑗,𝑘
𝑎
𝜏𝒋.
𝑗=1
𝑏
𝑘=1
2
554.88
= 𝟐𝟑. 𝟎𝟖
3 4
𝜏2 1
− = 2274.24 − 554.88 = 𝟏𝟑. 𝟔𝟖
𝑛
4
2
𝜏
1
2
𝜏.𝒌 − = 1673.10 − 554.88 = 𝟐. 𝟖𝟐
𝑛
3
𝜐𝑒 = 𝜐 − 𝜐𝑟 − 𝜐𝑐 = 23.08 − 13.68 − 2.82 = 𝟔. 𝟓𝟖
Tabla de Análisis de Varianza
Variación
Grados de
Libertad
Media de Cuadrados
Entre Tratamientos
𝜐𝑟 = 13.68
2
𝒔r 𝟐 = 6.84
Entre Bloques
𝜐𝑐 = 2.82
3
𝒔𝑐 𝟐 = 0.94
Residual o aleatoria
𝜐𝑒 = 6.58
6
𝒔𝑒 𝟐 = 1.097
Total
11
𝜐 = 23.08
F
𝒔𝑟 𝟐
𝒔𝑒 𝟐
F=6.24
Con 2,6 grados de
libertad
𝟐
𝒔
𝑐
𝑭 =
𝒔𝑒 𝟐
F=0.86
Con 3,6 grados de
libertad
𝑭 =
Conclusiones: Problema 5
• Al nivel de significación de 0.05 con 2,6 grados
de libertad, F0.95 = 5.14, entonces, ya que
6.24>5.14 podemos rechazar la hipótesis de
que las medias de fila son iguales y concluir
que al nivel de 0.05 hay una diferencia
significativa en el rendimiento debido a los
fertilizantes.
Conclusiones: Problema 5
• Ya que el valor de F correspondiente a las
diferencias en las medias de columna es
menor que 1 podemos concluir que no hay
diferencia significativa en el rendimiento
debido a las cosechas.