Transcript Covarianza

Análisis de Covarianza
Contenido
 Introducción
 Objetivos del análisis de covarianza
 Suposiciones
básicas
para
el
análisis
de
covarianza
 Modelos y análisis de covarianza
 Cómo hacer el análisis de covarianza
 Ejemplos
2
Introducción
El análisis de covarianza es una
de las técnicas usadas para reducir
el error experimental, y con ello
poder detectar diferencias entre
tratamientos.
3
Introducción
Es frecuente encontrar que al realizar
experimentos con alimentos, los resultados
de una característica determinada (variable
estudiada Y) se vean afectados por la
variación en otra de las características (X), la
cual se puede medir, pero no se puede
controlar experimentalmente.
4
Introducción
Una covariable (X) es una medición o
característica de cada unidad experimental, la
cual se supone independiente de los
tratamientos, y se conoce que está relacionada
con la medición de interés (Y).
Cuando varía X, se espera un cambio o
variación de Y; este cambio afectará el efecto de
los tratamientos sobre Y.
5
Objetivos del análisis de covarianza
Los usos mas frecuentes del análisis de
covarianza son:

Para aumentar la precisión de los experimentos.

Para remover el efecto de variables que afectan
estudios observacionales.

Para dar mayor información sobre la naturaleza de
los tratamientos.

Para ajustar regresiones
clasificación múltiple.

en
modelos
de
Para corregir por observaciones perdidas.
6
Objetivos del análisis de covarianza
Aumento de precisión de los experimentos.
La ganancia en precisión experimental
dependerá de la relación entre X y Y.
Si s2ε es el error experimental, el uso de la
covarianza lo reducirá en:
S2ε (1- r2) [1 + (glerror - 2)-1]
donde:
r es el coeficiente de correlación entre X y Y.
glerror son los grados de libertad del error (s2ε).
7
Objetivos del análisis de covarianza
Aumento de precisión de los experimentos.
Cuando el error experimental se reduce,
se logra un aumento en la precisión del
experimento.
Esto
sucederá
si
la
correlación entre X y Y es mayor que 0.3
aproximadamente.
8
Objetivos del análisis de covarianza

Remoción del efecto de variables adicionales que
afectan la respuesta de interés.
En un estudio, se compararon 7 variedades de
frijol tépari con relación a su contenido en hierro
soluble. El contenido de hierro soluble depende del
hierro total presente, así como de la presencia de
factores inhibidores, tales como los fosfatos.
Mediante un análisis de covarianza se puede
estimar, si las variedades cambian en el contenido de
hierro soluble per se, o el cambio en hierro soluble se
debe a las diferentes concentraciones de inhibidores,
como los fosfatos.
9
Objetivos del análisis de covarianza

Obtener mayor información sobre la
naturaleza de los tratamientos.
Si las diferencias entre tratamientos
desaparecen
después
de
ajustar
por
covarianza, o si cambian de algún modo, esto
sugerirá al investigador que las diferencias
entre tratamientos pueden proceder de las
diferencias entre los promedios de X, no de las
diferencias en respuesta (Y).
10
Objetivos del análisis de covarianza

Ajuste de regresiones en modelos de clasificación
múltiple.
El análisis de covarianza nos puede servir para
conocer si las pendientes de regresión de diferentes
factores son homogéneas (paralelas).

Corrección por observaciones perdidas.
El Andecova permite ajustar las sumas de
cuadrados del Andeva por observaciones perdidas en
el caso de diseños en bloques al azar o en cuadro
latino.
11
MODELO DE COVARIANZA
El modelo lineal para el análisis de covarianza,
dependerá del diseño experimental empleado, de la
estructura de los tratamientos y del número de
covariables considerado.
El caso más sencillo es el de un diseño
Completamente al Azar, con r repeticiones por
tratamiento, con una estructura de tratamientos
simple, de t tratamientos, y con una covariable (X).
12
MODELO DE COVARIANZA
Yij  i  (xij  X )  ij
i=1,2,...,t ;
j=1,2,...r.
Donde:
Yij : Observación ij-ésima de la variable respuesta Y
μ : Promedio general de Y
i : Efecto del tratamiento i-ésimo
ß : Coeficiente de regresión entre X y Y
Xij : Observación ij-ésima de la covariable X
XM: Promedio general de la covariable X
εij : Error aleatorio de la observación ij-ésima.
13
SUPOSICIONES BASICAS
Las suposiciones básicas del modelo son:
1. El modelo es el verdadero, lineal en sus parámetros.
2. La covariable está medida sin error.
3. La relación entre la variable respuesta (Y), y la
covariable (X), no cambia con los tratamientos.
4. La variable Y tiene distribución aproximadamente
normal
5. Los errores aleatorios son independientes, con media
igual a 0 y varianza σ2 (error).
14
SUPOSICIONES BASICAS
La suposición que hay que
confirmar generalmente es la tercera,
ya que si los tratamientos afectan la
relación entre X y Y, el modelo de
covarianza no es el adecuado.
15
CALCULO DEL ANDECOVA
El análisis de covarianza se hará siguiendo los
siguientes pasos:
1. Agrupe los datos según se puede ver en el Cuadro I.
2. Calcule las Sumas de Cuadrados para Y y para X como
si fueran dos análisis de varianza separados.
SC (TOTAL)YY = ΣΣ Yij2 - (Y2../rt) = TYY
3.
Calcule las Sumas de Productos Cruzados de X y Y,
como en el análisis de regresión:
SP(TRAT)XY = (Y1.*X1.+Y2.*X2.+...+Yt.*Xt.)/r - [(Y..)*(X..)/rt]
16
CALCULO DEL ANDECOVA
REP
Trat. 1
Trat.1
Trat. 2
Trat 2
.
.
Trat t
Trat. t
1
X11
Y11
X21
Y21
.
.
X11
Y
2
X12
Y12
X22
Y22
.
.
Xt2
Yt2
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
r
X1r
Y1r
X2r
Y2r
.
.
Xtr
Ytr
Subt.
Trat
X1.
Y1.
X2.
Y2.
.
.
Xt.
Yt.
17
CALCULO DEL ANDECOVA
4. Use la siguiente notación para ordenar sus cálculos:
Tyy : Suma de Cuadrados Total de Y.
Txx : Suma de Cuadrados Total de X.
Txy : Suma de Productos Cruzados Total de X por Y.
Tryy : Suma de Cuadrados de Tratamientos de Y.
Trxx : Suma de Cuadrados de Tratamientos de X.
Trxy: Suma de Productos Cruzados De Tratamientos.
Eyy : Suma de Cuadrados del Error de Y.
Exx : Suma de Cuadrados del Error de X.
Exy : Suma de Productos Cruzados del Error.
5. Arme el cuadro de Análisis de Covarianza (ANDECOVA), como se
muestra en siguiente cuadro.
18
CALCULO DEL ANDECOVA
Suma de Cuadrados
Fuente
Gl
XX
XY
YY
Tratam.
t-1
TRXX
TRXY
TRYY
Error
t(r-1)
EXX
EXY
EYY
Suma
TRXX + EXX
TRXY + EXY
TRYY + EYY
Total
TXX
TXY
TYY
19
CALCULO DEL ANDECOVA
6. Haga los siguientes cálculos:
SCEC = EYY - EXY2/EXX
SCTC = (TRYY+EYY) - (TRXY+EXY)2/(TRXX+EXX)]
SCTRC = SCTC -SCEC
7. Arme el cuadro final de ANDECOVA como
sigue:
20
CALCULO DEL ANDECOVA
FUENTE
GL
SC
CM
F
TRAT
t-1
SCTRC
CMTRC
CMTRC/CMEC
REGRESION
1
(EXY)2/EXX
CMREG
CMREG/CMEC
ERROR
t(r-1)-1
SCEC
CMEC
.
21
PRUEBAS DE HIPOTESIS EN ANDECOVA
Las pruebas de hipótesis de interés son dos:
a. No existe regresión entre X y Y, o sea Ho: ß =0. Esta
hipótesis se prueba con el estadístico
F = CMREG /CMEC.
Si F es mayor que Fα,{1,(t(r-1)-1)}, entonces la
regresión entre X y Y es significativa, y el análisis de
covarianza probará ser eficiente.
22
PRUEBAS DE HIPOTESIS EN ANDECOVA
b. Hay diferencias entre tratamientos:
Ho: τ1=τ2=...=τt
Esta hipótesis se probará con el estadístico
F = CMTRC/CMEC.
Si F es mayor que Fα,{(t-1),[t(r-1)-1]}, las diferencias
entre tratamientos serán significativas.
23
PRUEBAS DE HIPOTESIS EN ANDECOVA
Tanto si hay diferencias significativas o
no, cuando la regresión fue significativa,
los promedios de los tratamiento se
deberán ajustar por los cambios que
ocurren en la covariable para cada
tratamiento.
24
PRUEBAS DE HIPOTESIS EN ANDECOVA
La estimación de las medias ajustadas de
Y es:
ˆ
Y  Y  b(X  X)
i
i
i
Donde
Yi : Promedio ajustado por covarianza del i-ésimo tratamiento;
Yi : Promedio del i-ésimo tratamiento.
b = EXY/EXX : Estimación del coeficiente de regresión (ß);
Xi : Promedio de X del i-ésimo tratamiento
X.. : Promedio general de las X's.
25
PRUEBAS DE HIPOTESIS EN ANDECOVA
Para hacer comparaciones de promedios
ajustados, se deberán comparar todos los pares
de promedios de tratamientos, ya que la
desviación estándar de la media de un
tratamiento ajustado, es diferente de la que se
usa para el análisis de varianza. (Ver Steel y
Torrie, pág 406).
Los
paquetes
computacionales
de
estadística, como el JMP, hacen el análisis de
covarianza en forma más sencilla.
26
EJEMPLO
En un experimento se compararon 11
variedades de habas por su contenido en
ácido ascórbico (en microgramos por gramo
de muestra).
Por experiencias previas se sabe que el
grado de madurez afecta el contenido de
ácido ascórbico.
Se midió el porcentaje de materia seca,
como un índice indirecto del grado de
madurez.
27
EJEMPLO
Para poder comparar las diferentes
variedades hay que realizar un análisis de
covarianza de estos datos, de forma de
corregir el contenido de AA por el grado de
madurez de las plantas.
La relación entre la materia seca y el
ácido ascórbico es inversa, o sea, a mayor
% de materia seca, menor contenido de AA.
28
Ejemplo
29
EJEMPLO 2
El diseño experimental empleado fue de
bloques completos al azar, con 11
variedades y tres repeticiones.
El modelo propuesto para el análisis
es:
Y  v  b  (x  X)  
ij
i
j
ij
ij
30
EJEMPLO
Se verá el ejemplo usando el JMP.
31
DISCUSION DE USOS DEL ANDECOVA
 Proponga ejemplos de uso del análisis de
covarianza
 Cuál de las aplicaciones del ANDECOVA le parece
más útil en las investigaciones en alimentos.
 Uso de mediciones iniciales como covariables, al
analizar mediciones finales.
 Cambios en los promedios estimados de Y, y
cómo se realizan las pruebas de comparación
múltiple de medias.
32
Resumen
 Qué es el ANDECOVA
 Objetivos del ANDECOVA
 Usos más frecuentes
 Modelo y análisis de datos
 Pruebas de hipótesis en
ANDECOVA
el
 ANDECOVA con JMP
33