ANÁLISIS DE DISCRIMINANTE

Download Report

Transcript ANÁLISIS DE DISCRIMINANTE

ANÁLISIS DISCRIMINANTE
ANÁLISIS DISCRIMINANTE
Idea General
El análisis de función discriminante es usado para determinar cuales
variables disciernen entre dos o mas grupos naturales. Por ejemplo,
un investigador en biología quiere discernir que variables sirven para
separar las especies de un género de plantas. Para tal propósitos
este investigador puede obtener diferentes mediciones de varias
variables. El análisis de discriminantes puede ayudar a decidir cuales
son las mejores variables para separar las especies
ANÁLISIS DISCRIMINANTE
Proceso computacional.
La parte operativa del AD es muy similar al análisis de varianza
(ANOVA). Permítanos considerar un ejemplo simple. Suponga que
medimos la longitud de un grupo al azar 50 hembras y 50 machos
de una especie de roedores. Las hembras son, en promedio un
poco más pequeñas que los machos. A esta diferencia se reflejará
en la diferencia de las medias (para la variable longitud). Por lo
tanto, la variable longitud nos permite DISCRIMINAR entre machos
y hembras con una mejor probabilidad, si un individuo es largo es
más probable que sea macho, si es mas pequeña es más probable
que sea hembra.
ANÁLISIS DISCRIMINANTE
Proceso computacional
Podemos generalizar este razonamiento de grupos y variables de
forma menos “trivial”. Por ejemplo, suponga que tenemos dos
grupos de plantas del i-ésimo género pero diferente especie,
nosotros podemos decir que la media es diferente y usar alguna
medida somática para diferenciarlos, si después requerimos
clasificar un nuevo ejemplar del mismo género podremos
clasificarlo usando el mismo razonamiento.
En suma el AD sirve para diferenciar grupos basados en la media
de la (s) variables consideradas
ANÁLISIS DISCRIMINANTE
Extensión a varias variables
Normalmente usamos varias variables en un estudio para poder
saber cual(es) ayudan a la separación entre grupos. En este caso
tenemos una MATRIZ DE VAIANZAS Y COVARANZAS, también
tenemos una matriz de varianzas dentro de grupo. Podemos
comparar esas dos matices vía una F multivariada para determinar
si hay diferencias significativas o no (con respecto a todas las
variables) este procedimiento es idéntico a un proceso múltiple de
análisis de varianza llamado MANOVA (a pesar de que los procesos
de cómputo cambian la idea básica permanece igual
ANÁLISIS DISCRIMINANTE
El Modelo
Poniendo de otra manera nosotros podemos construir un Modelo que
puede predecir de MEJOR MANEA a grupo pertenece cada caso. En el
futuro nos referiremos al término en el modelo para indicar aquellas
variables que entran en el modelo predictivo y no en el modelo para
indicar aquellas que no
ANÁLISIS DISCRIMINANTE
Análisis por pasos “Stepwise”
En el proceso “stepwise” un modelo se construye paso a paso,
específicamente en cada paso todas las variables son revisadas y
evaluadas para determinar cuales contribuirán más a la
discriminación entre grupos . Esa variable se incluye en el modelo y
se inicia otra vez.
El proceso stepwise inverso o de retirar variables Inicia con todas las
variables y va retirando aquellas que no sean significativas.
ANÁLISIS DISCRIMINANTE
F para entrar
El proceso Stepwise es “guiado” por las respectivas F para entrar
o salir. El valor de F para una variable si esta es estadísticamente
significativa en la discriminación entre grupos, esto es, si es una
medida que hace una contribución a la predicción del grupo. Es
análogo al sistema de regresión múltiple.
ANÁLISIS DISCRIMINANTE
Cuidado con la interpretación
Una interpretación errada del proceso discriminante stepwise es
tomar la significancia estadística como el valor frontal. Por
naturaleza el proceso stepwise capitaliza l porque selecciona las
variables a ser incluidas en el modelo. Por tanto, al usar el proceso
stepwise el investigador debe estar conciente de que los niveles de
significancia no refleja la verdadera posibilidad de comete el error
tipo I
ANÁLISIS DISCRIMINANTE
discriminación de dos grupos
Cuando sólo se tienen dos grupos (ejemplo dos especies ) es
fácil entender que una sola función nos puede ayudar a
diferenciar entre ambas. Usando el grupo 1 ó 2 como variable
respuesta y las b como los coeficientes de las variables
explicativas
Group = a + b1*x1 + b2*x2 + ... + bm*xm
Esta interpretación és fácil de entender y muy ligada a la
regresión múltiple.
ANÁLISIS DISCRIMINANTE
más de dos grupos
Si se tienen más de dos grupos (especies) entonces necesitamos
mas de una función discriminante. Por ejemplo si tenemos tres
grupos requeriremos una función discriminante entre el grupo 1 y
los grupos 2 y 3 combinados y una segunda función para distinguir
entre los grupos 2 y 3. Por ejemplo podemos poner una función
que discrimine entre la especie mas común y las otra y otra que
discrimine entre las otras dos especies, igual que en el caso
anterior aquellos coeficientes de mayor valor absoluto iniciarán las
variables que mas aportan a la discriminación