Transcript Document

Estadística Administrativa II

2014-3 Análisis de Correlación

Características

› Técnica para estudiar la relación entre dos variables › Una independiente y una dependiente › Los resultados de la dependiente depende de los valores que tome la independiente › Ideal para trabajar con pronósticos › Se utilizan valores reales y valores estimados

Análisis de Correlación

Estudio de la relación entre variables Análisis inicial

Análisis de correlación

› Gráfico de dispersión – Variable independiente en el eje X – Variable dependiente en el eje Y › Coeficiente de correlación – Medida de la fuerza de relación lineal entre dos variables

Características del coeficiente de Correlación

1.

2.

Muestra la dirección y fuerza de la relación lineal (recta) entre dos variables en escala de intervalo o razón.

El coeficiente de correlación de la muestra se identifica por la letra minúscula 𝑟 (también llamado r-Pearson) Varía desde -1 hasta 1, inclusive.

3.

4.

5.

Un valor cercano a 0 indica que hay poca asociación entre las variables.

Un valor cercano a 1 indica una asociación directa o positiva entre las variables.

6. Un valor cercano a 1 indica una asociación inversa o negativa entre las variables.

Coeficiente de Correlación

› Correlación positiva perfecta › Correlación negativa perfecta › Si la r de Pearson es 0; indica que no hay relación lineal entre ambas variables

Coeficiente de Correlación

› El valor resultante de la correlación se identifica de acuerdo a su nivel de fuerza. Mientras más se aleja del cero, la correlación pasa de débil a fuerte.

Coeficiente de Correlación

𝑟 = 𝑛 − 1 𝑠 𝑋 𝑠 𝑌 › › › › › › › 𝑋 = Cada dato de la variable independiente 𝑌 = Cada dato de la variable dependiente = Media aritmética de la variable independiente = Media aritmética de la variable dependiente 𝑛 = Tamaño de la muestra 𝑠 𝑋 = Desviación estándar de la variable independiente 𝑠 𝑌 = Desviación estándar de la variable dependiente

Ejemplo . . .

En la empresa Sara se venden unidades de aire acondicionado; se ha observado que a mayor cantidad de llamadas de los vendedores durante el mes, mayor cantidad de compra de unidades de aire acondicionado.

Se tomó una muestra de las ventas realizadas por 10 de los vendedores de planta y se quiere comparar la cantidad de llamadas realizadas durante el mes de Abril y las ventas facturadas.

Los resultados fueron los siguientes:

. . . Ejemplo

AGENTE

Tomás García José Girón Brian Velásquez Gregorio Figueroa Susana Vides Carlos Ramírez Ricardo Noriega Miguel Godoy Marcos Reyes Sonia Guzmán

LLAMADAS UNIDADES VENDIDAS

20 40 20 30 60 40 30 10 10 20 20 20 30 60 30 40 40 50 30 70 Empíricamente se puede observar los que hicieron llamadas vendieron más aires acondicionados.

Si por cada llamada, algunos clientes compraron unidades de aire acondicionado, significa que la variable independiente son las llamadas.

A las llamadas telefónicas se le asignará la variable X y a las unidades vendidas la variable Y.

. . . Ejemplo

AGENTE

Tomás García José Girón Brian Velásquez Gregorio Figueroa Susana Vides Carlos Ramírez Ricardo Noriega Miguel Godoy Marcos Reyes Sonia Guzmán

LLAMADAS X

20 40 20 30 10 10 20 20 20 30

UNIDADES VENDIDAS Y

30 60 40 60 30 40 40 50 30 70

Media Aritmética 22 45

𝑌 = 46 𝑛 = 10

. . . Ejemplo

AGENTE

Tomás García José Girón Brian Velásquez Gregorio Figueroa Susana Vides Carlos Ramírez Ricardo Noriega Miguel Godoy Marcos Reyes Sonia Guzmán

LLAMADAS X

20 40 20 30 10 10 20 20 20 30

UNIDADES VENDIDAS Y

30 60 40 60 30 40 40 50 30 70

Media Aritmética

𝑠 𝑋 = 𝑠 𝑌 =

22

-2 18 -2 8 -12 -12 -2 -2 -2 8

45 Total de Sumas

-15 15 -5 15 -15 -5 -5 5 -15 25 30 270 10 120 180 60 10 -10 30 200

900

4 324 4 64 144 144 4 4 4 64

760

225 225 25 225 225 25 25 25 225 625

1850

𝑛 − 1 2 = 760 10 − 1 = 84.44 = 9.19

𝑛 − 1 2 = 1850 10 − 1 = 205.56 = 14.34

. . . Ejemplo

𝑟 = 𝑛 − 1 𝑠 𝑋 𝑠 𝑌 = 900 10 − 1 9.19 14.34

= 0.759

0.759 indica una correlación positiva fuerte. Se observa una relación directa entre las llamadas realizadas y las ventas de unidades de aire acondicionado vendidos.

Correlación y Causa

› Si existe relación fuerte entre una variable X y una variable Y, no se puede suponer que la variable X

causó

un efecto en la variable Y; a esto se le llama relación

espuria

.

En el ejemplo anterior; no se puede suponer que las llamadas a los clientes fue lo que incrementó las ventas y tampoco asumir que si se hubieran realizado más llamadas se hubiera producido más ventas.

Solamente se concluyó que existe una relación fuerte entre ambas variables.

Coeficiente de Determinación

Proporción de la variación total en la variable dependiente

Y

que se explica, o contabiliza, por la variación en la variable dependiente

X

Coeficiente de Determinación

› Si existe una relación fuerte entre dos variables, el cambio en la variable independiente, genera una reacción en la dependiente.

› Un aumento en la variable X produce un aumento en la variable Y.

› Una disminución en la variable X produce una disminución en la variable Y.

› Proporción para interpretar el Coeficiente de Correlación o r-Pearson

Coeficiente de determinación

› Proporción de la variación total en la variable dependiente

Y

que se explica, o contabiliza, por la variación en la variable dependiente

X

.

› Cálculo: Elevar al cuadrado el coeficiente de correlación 𝑟 2

Ejemplo . . .

La empresa Sara determinó que existe una fuerte relación entre las llamadas realizadas por 10 empleados durante el mes de Abril y las ventas de unidades de aire acondicionado facturadas, debido a que su coeficiente de correlación resultó ser 0.759.

Cuál es la proporción de las ventas que tienen relación con las llamadas 𝑟 2 = 0.759

2 𝑟 2 = 0.576

R:// La relación de las ventas con la llamadas es el 58%.

Prueba de la importancia del coeficiente de correlación

Siempre se espera que la correlación lineal entre dos variables sea igual a 0.

Prueba de la importancia del coeficiente de correlación

› Para determinar si la correlación fuerte entre dos variables produce incremento o disminución se recurre a la prueba de Hipótesis.

› 𝐻 0 : 𝜌 = 0 (correlación de la población igual a 0) › 𝐻 𝑎 : 𝜌 ≠ 0 (correlación de la población diferente a 0) › Estadístico de prueba: distribución t › Prueba t para el coeficiente de correlación: 𝑟 𝑛 − 2 𝑡 = 1 − 𝑟 2

Ejemplo . . .

L a empresa Sara determinó que existe una fuerte relación entre las llamadas realizadas por 10 empleados durante el mes de Abril y las ventas de unidades de aire acondicionado facturadas, debido a que su coeficiente de correlación resultó ser 0.759.

Sin embargo se supone que el coeficiente de correlación debería ser 0. Es hora de probar esa hipótesis con un 95% de confiabilidad.

Los datos obtenidos solo son una muestra de 10 de los empleados

. . . Ejemplo

› 𝐻 0 : 𝜌 = 0 𝐻 𝑎 : 𝜌 ≠ 0 › 𝛼 = 0.05

› Estadístico de prueba: 𝑡 = 𝑟 𝑛−2 1−𝑟 2 › Regla de decisión 2 𝑐𝑜𝑙𝑎𝑠 𝛼 = 0.05

𝑔𝑙 = 8 𝑡 = 2.306

. . . Ejemplo

› Toma de decisión 𝑟 𝑛 − 2 𝑡 = = 0.759 10 − 2 1 − 𝑟 2 1 − 0.759

2 = 0.759 8 0.4239

= 2.1468

= 3.297

0.651

› La hipótesis nula no se acepta.

› hay una correlación entre el numero de llamadas de ventas hechas y el numero de unidades de aire acondicionado vendidas en la población de vendedores

Lind, D.A., Marchal, W.G., Wathen, S.A. (15). (2012).

Estadística Aplicada a los Negocios y la Economía

. México: McGrawHill 24