SUPUESTOS DEL ANALISIS DE VARIANZA

Download Report

Transcript SUPUESTOS DEL ANALISIS DE VARIANZA

SUPUESTOS DEL ANALISIS DE VARIANZA

Mario Briones L.

MV, MSc 2005

Principales supuestos

    Los términos del error son aleatoria, independiente y normalmente distribuidos.

Las varianzas de los diferentes grupos son homogéneas.

Las varianzas y los promedios de los grupos no están correlacionados.

Los efectos principales son aditivos.

Normalidad

  Las desviaciones de la normalidad no afectan seriamente la validez del análisis. Independencia significa que no hay relación entre el tamaño de los términos de error y el grupo al cual pertenecen.

Homogeneidad de las varianzas

  El análisis de varianza utiliza un cuadrado medio de error combinado, para obtener la mejor estimación de una varianza común a todos los grupos.

Si las varianzas entre los grupos son diferentes no hay justificación para combinarlas.

Homogeneidad de las varianzas

 Ejemplo Varianzas iguales m Hipótesis nula verdadera m 1 m 2 m 3 m 4 Hipótesis nula falsa No existen problemas si las varianzas son iguales entre los grupos.

Homogeneidad de las varianzas

 Ejemplo Varianzas diferentes m Hipótesis nula verdadera m 1 m 2 m 3 m 4 Hipótesis nula falsa No existen problemas si las varianzas son iguales entre los grupos.

Ejemplo

PROMEDIO S 2 A 3 1 5 4 2 3 2.5

8 7 4 B 6 tratamientos C 12 5 6 9 3 15 6 2.5

9 22.5

D 20 14 11 17 8 14 22.5

Tabla de Análisis de Varianza

ANÁLISIS DE VARIANZA

FV

Entre grupos

SC

Dentro de los grupos 330 200

GL

3 16

CM

110 12.5

F

8.8

Probabilidad

0.00111862

Total 530 19 LSD (diferencia mínima significativa, la menor diferencia entre dos grupos que será estadísticamente significativa.

LSD

t CM ERROR

  1

n

1  1

n

2  

LSD

 2 .

12 12 .

5  1 5 1 5  4 .

74

Conclusión

  La diferencia mínima significativa es razonable para la diferencia entre los promedios de C y D pero no lo es para los promedios Ay B.

La solución es analizar los grupos AB y CD por separado.

ANÁLISIS DE VARIANZA

FV

Entre grupos

SC

Dentro de los grupos 22.5

20 entre A y B

gl

1 8 Total 42.5

9 ANÁLISIS DE VARIANZA

FV

Entre grupos

SC

Dentro de los grupos 62.5

180 entre C y D

gl

1 8 Total 242.5

9

CM

22.5

2.5

CM

62.5

22.5

F

9

Probabilidad

0.01707168

F

2.77777778

Probabilidad

0.13414064

Independencia de medias y varianzas

  A veces existe una relación definida entre las muestras y sus varianzas.

Generalmente invloucra mayor varianza para las muestras que tienen mayor promedio.

Independencia de medias y varianzas

 Ej. Aplicación de insecticidas para el control de garrapata en el perro    Dos tratamientos poco efectivos: 305 y 315 garrapatas sobrevivientes Dos tratamientos efectivos: 5 y 15 garrapatas sobrevivientes.

Si las varianzas son homogéneas y no relacionadas con las medias, ambas diferencias tienen la misma importancia dado que tienen la misma magnitud.

Independencia de medias y varianzas

  Otro ejemplo: un investigador desea probar el efecto de una nueva vitamina sobre el peso de animales y desea incluir varias especies para darle amplitud a sus inferencias.

Las magnitudes de las diferencias de interés en las diferentes especies son completamente diferentes.

Supuesto de Aditividad

     Cada diseño experimental tiene un modelo matemático denominado modelo lineal aditivo.

Ej. En un análisis con un factor como causa de variación: Y ij = m +A i +e ij En un análisis con dos factores (ej. Tratamiento y bloque: Y ijk = m + A i +B j +e ijk

 Modelo lineal aditivo significa que la varianza de una observación individual (Y), perteneciente a una estructura clasificada de datos, es función de la media poblacional m , MAS los efectos de las diferentes clasificaciones y el error residual asociado a las observaciones ya clasificadas

 Por ejemplo, en un diseño en bloque al azar, la linearidad implica que el efecto de un tratamiento es el mismo en todos los bloques y que el efecto de bloque es el mismo para todos los tratamientos.

Prueba de Bartlett para homogeneidad de varianzas

 El test de Bartlett tiene distribución de Chi cuadrado con un grado de libertad y es igual a

X

0 2  2 .

3026

q c

Estadístico de Bartlett:

q c

 (

N

 1  

a

) 3 (

a

1 log 10  1 )  

S P

2 

i a

  1 (

n i i a

  1 (

n i

 1 )  1  1 ) log 10  (

N S i

2 

a

)  1  

S P i

i a

  1 (

n i N

 1 )

S i

2 

a

N= total de observaciones a= número de grupos S 2 i = varianza muestreal del i ésimo grupo

En Internet:

home.ubalt.edu/ntsbarsh/Business-stat/otherapplets/BartletTest.htm

Realiza comparación de homogeneidad de varianzas hasta en 14 grupos.

Se ingresa el número de observaciones por grupo y la varianza

Transformaciones

 Transformaciones de escala de los datos permiten corregir muchas de las violaciones de los supuestos

Transformación logarítmica

  Cada vez que las desviaciones estándares (NO LAS VARIANZAS sean proporcionales a los promedios, la transformación más apropiada será la logarítmica.

También en casos que exista evidencia de efectos multiplicativos en lugar de aditivos.

Transformación logarítmica

    Cualquier logaritmo sirve, base 10 es el más utilizado.

Cuando existen ceros, reemplazan por 1.

Si hay muchos ceros no es conveniente utilizar esta metodología.

Antes de la transformación es posible multiplicar todos los datos por una constante.

Transformación de raíz cuadrada

 Normalmente se aplica cuando se trata de números que registran acontecimientos poco comunes.

   Observaciones de animales en transectos.

Animales muertos en diferentes grupos.

Se calcula directamente la raíz cuadrada y se hace el ANDEVA o bien se utiliza la siguiente expresión para valores menores a 10

X

´ 

X

 1 2

Transformación angular o de Bliss

 Se efectúa para analizar datos de porcentajes, en los cuales, de modo natural, la varianza no es homogenea.

  Se saca raiz de la proporción (no del porcentaje).

Se saca seno inverso del resultado.

Transformación angular o de Bliss

porcentajes 30 proporción 0.3

raiz cuadrad seno inverso 0.54772256

33.21

32 45 0.32

0.45

0.56568542

0.67082039

34.45

42.13

65 47 50 0.65

0.47

0.5

0.80622577

0.68556546

0.70710678

53.73

43.28

45.00

Formula del seno inverso= ASENO(X)*180/PI()