Diapositivas sobre Estadística Bivariante

Download Report

Transcript Diapositivas sobre Estadística Bivariante

ELEMENTOS DE
ESTADÍSTICA BIVARIANTE
Dpto. de Cs. Matemáticas y Física
Área Estadística
Prof. Juan Moncada Herrera
Estadística Bivariante
Objetivos
Estudiar, explorar y/o valorar la relación o
asociación existente entre DOS variables
Estadística Bivariante
Escenarios posibles
Ambas Variables
Cualitativas
Cuantitativas
Estadística Bivariante
Esquema de análisis
ESTUDIO DE LA ASOCIACIÓN
EXPLORACIONES BÁSICAS
MEDIDA DE ASOCIACIÓN
SIGNIFICANCIA ASOCIACIÓN
Estadística Bivariante
AMBAS VARIABLES CUANTITATIVAS
Estadística Bivariante
Cuantitativa
Descriptiva > Gráfica
Diagrama de Dispersión
Estadística Bivariante
Cuantitativa
Descriptiva > Gráfica
Diagrama de Dispersión
Estadística Bivariante
Cuantitativa
Descriptiva > Gráfica
Diagrama de Dispersión
Estadística Bivariante
Cuantitativa
Descriptiva > Numérica
n
r
X Y
i 1
i i
 nXY
(n  1) S X S Y
Coeficiente de correlación
lineal de Pearson
Estadística Bivariante
Cuantitativa
Descriptiva > Numérica
El porcentaje de variabilidad de Y explicado por la variabilidad en X lo
mide el coeficiente de determinación, que corresponde a r2.
Estadística Bivariante
Cuantitativa
Descriptiva > Numérica
X
16 14 22 10 14 17 10 13 19 12 18 11
Y
77 70 85 50 62 70 52 63 80 57 81 54
X: Puntaje en un sistema de aprendizaje
Y: Costo asociado al logro del puntaje
Estadística Bivariante
Cuantitativa
Inferencial
H0: Las variables son independientes
(Variables no relacionadas)
Ha: Las variables No son independientes
(Variables relacionadas)
Estadística Bivariante
Cuantitativa
Inferencial
Estadístico de Prueba:
Tobs 
r n2
1 r
2
~ t n2
Estadística Bivariante
AMBAS VARIABLES CUALITATIVAS
Estadística Bivariante
Cualitativa
Los Objetivos
DADAS DOS CARACTERÍSTICAS DE LA POBLACIÓN, Y EN
BASE A LAS FRECUENCIAS U OBSERVACIONES
CORRESPONDIENTES: ¿EXISTE ALGUNA RELACIÓN ENTRE
TALES CARACTERÍSTICAS, O MÁS BIEN SON ELLAS
INDEPENDIENTES?
Estadística Bivariante
Cualitativa
Preliminares
Punto de partida: El cuestionario

Estadística Bivariante
Cualitativa
Preliminares
Variables
cualitativas
Individuos
La Tabla de Datos

1
2
...
n
X1
X2
Estadística Bivariante
Cualitativa
Preliminares
Tabla de códigos condensados
Ind
Carrera
Adsc.Rel
1
B
C2
2
C
C2
3
A
C1
4
A
C2
5
A
C2
6
D
C2
7
B
C2
8
D
C2
9
C
C2
10
C
C2
11
A
C1
12
D
C1
13
D
C1
14
B
C1
15
C
C1
Estadística Bivariante
Cualitativa
Resumen-Descripción
La Tabla de Frecuencias o Tabla de Contingencia:
Un Primer Resumen
ADSC. RELIG.
CARRERA
A
B
C
D
TOTALES
COLUMNA
C1
C2
TOTALES
FILAS
Ind
Carrera
Adsc.Rel
1
B
C2
2
C
C2
3
A
C1
4
A
C2
5
A
C2
6
D
C2
7
B
C2
8
D
C2
9
C
C2
10
C
C2
11
A
C1
12
D
C1
13
D
C1
14
B
C1
15
C
C1
Estadística Bivariante
Cualitativa
Resumen-Descripción
La Tabla de Frecuencias o Tabla de Contingencia:
Un Primer Resumen: Construcción
ADSC. RELIG.
CARRERA
C1
C2
TOTALES
FILAS
A
2
2
4
B
1
2
3
C
1
3
4
D
2
2
4
TOTALES
COLUMNA
6
9
15
Ind
Carrera
Adsc.Rel
1
B
C2
2
C
C2
3
A
C1
4
A
C2
5
A
C2
6
D
C2
7
B
C2
8
D
C2
9
C
C2
10
C
C2
11
A
C1
12
D
C1
13
D
C1
14
B
C1
15
C
C1
Estadística Bivariante
Cualitativa
Resumen-Descripción
La Tabla de Frecuencias o Tabla de Contingencia:
Un Primer Resumen: Representación gráfica
ADSC. RELIG.
Distribución filas
CARRERA
C1
C2
TOTALES
FILAS
4
A
2
2
4
3
B
1
2
3
2
C
1
3
4
1
D
2
2
4
0
TOTALES
COLUMNA
6
9
15
A
B
C
D
Estadística Bivariante
Cualitativa
Resumen-Descripción
La Tabla de Frecuencias o Tabla de Contingencia:
Un Primer Resumen: Representación gráfica
ADSC. RELIG.
CARRERA
C1
C2
TOTALES
FILAS
A
2
2
4
B
1
2
3
C
1
3
4
D
2
2
4
TOTALES
COLUMNA
6
9
15
Distribución columnas
C1
C2
Estadística Bivariante
Cualitativa
Resumen-Descripción
La Tabla de Frecuencias o Tabla de Contingencia:
Un Primer Resumen: Representación gráfica
Religión según Carrera
ADSC. RELIG.
CARRERA
C1
C2
TOTALES
FILAS
A
2
2
4
B
1
2
3
C
1
3
4
D
2
2
4
TOTALES
COLUMNA
6
9
15
3
2.5
2
1.5
C1
1
C2
0.5
0
A
B
C
Carrera
D
Estadística Bivariante
Cualitativa
Resumen-Descripción
La Tabla de Frecuencias o Tabla de Contingencia:
Un Primer Resumen: Representación gráfica
Carrera según Religión
ADSC. RELIG.
CARRERA
C1
C2
TOTALES
FILAS
A
2
2
4
B
1
2
3
3
2.5
2
A
1.5
B
1
C
1
3
4
D
2
2
4
TOTALES
COLUMNA
6
9
15
C
0.5
D
0
C1
C2
Religión
Estadística Bivariante
Cualitativa
Resumen-Descripción
La Tabla de Frecuencias Relativas: Haciendo “comparables” dos tablas
Frecuencias Absolutas
Frecuencias Relativas
ADSC. RELIG.
CARRERA
ADSC. RELIG.
C1
C2
TOTALES
FILAS
CARRERA
A
2
2
4
A
B
1
2
3
B
C
1
3
4
C
D
2
2
4
D
TOTALES
COLUMNA
6
9
15
TOTALES
COLUMNA
C1
2/15
C2
TOTALES
FILAS
Estadística Bivariante
Cualitativa
Resumen-Descripción
La Tabla de Frecuencias Relativas: Haciendo “comparables” dos tablas
Frecuencias Absolutas
Frecuencias Relativas
ADSC. RELIG.
CARRERA
ADSC. RELIG.
C1
C2
TOTALES
FILAS
CARRERA
A
2
2
4
A
B
1
2
3
B
C
1
3
4
C
D
2
2
4
D
TOTALES
COLUMNA
6
9
15
TOTALES
COLUMNA
C1
C2
2/15
2/15
TOTALES
FILAS
Estadística Bivariante
Cualitativa
Resumen-Descripción
La Tabla de Frecuencias Relativas: Haciendo “comparables” dos tablas
Frecuencias Absolutas
Frecuencias Relativas
ADSC. RELIG.
CARRERA
ADSC. RELIG.
C1
C2
TOTALES
FILAS
A
2
2
4
B
1
2
C
1
D
TOTALES
COLUMNA
CARRERA
C1
C2
TOTALES
FILAS
A
2/15
2/15
4/15
3
B
1/15
2/15
3/15
3
4
C
1/15
3/15
4/15
2
2
4
D
2/15
2/15
4/15
6
9
15
TOTALES
COLUMNA
6/15
9/15
1
Estadística Bivariante
Cualitativa
Resumen-Descripción
Comparaciones pertinentes: Las Tablas de Perfiles
Frecuencias absolutas
Perfiles Fila (o Linea)
ADSC. RELIG.
CARRERA
ADSC. RELIG.
C1
C2
TOTALES
FILAS
A
2
2
4
B
1
2
C
1
D
TOTALES
COLUMNA
CARRERA
C1
C2
TOTALES
FILAS
A
2/4
2/4
1
3
B
1/3
2/3
1
3
4
C
1/4
3/4
1
2
2
4
D
2/4
2/4
1
6
9
15
TOTALES
COLUMNA
6
9
15
Estadística Bivariante
Cualitativa
Resumen-Descripción
Comparaciones pertinentes: Las Tablas de Perfiles
Frecuencias absolutas
Perfiles columna
ADSC. RELIG.
CARRERA
ADSC. RELIG.
C1
C2
TOTALES
FILAS
A
2
2
4
B
1
2
C
1
D
TOTALES
COLUMNA
CARRERA
C1
C2
TOTALES
FILAS
A
2/6
2/9
4
3
B
1/6
2/9
3
3
4
C
1/6
3/9
4
2
2
4
D
2/6
2/9
4
6
9
15
TOTALES
COLUMNA
1
1
15
Estadística Bivariante
Cualitativa
Inferencia
Las Hipótesis
H0: Las variables son independientes
(Variables no relacionadas)
Ha: Las variables No son independientes
(Variables relacionadas)
Estadística Bivariante
Cualitativa
Inferencia
Midiendo la relación entre las variables: La tabla de Valores Esperados
Valores Observados
Valores Esperados
ADSC. RELIG.
ADSC. RELIG.
CARRERA
CARRERA
C1
C2
TOTALES
FILAS
A
2
2
4
A
B
1
2
3
B
C
1
3
4
C
D
2
2
4
D
TOTALES
COLUMNA
6
9
15
TOTALES
COLUMNA
C1
C2
(4*6)/15
(4*9)/15
TOTALES
FILAS
Estadística Bivariante
Cualitativa
Inferencia
Midiendo la relación entre las variables: El estadístico Chi-cuadrado

2
obs

 f obs  f ESP 
2
f ESP
~ 
2
fobs: Frecuencia absoluta observada
fESP: Frecuencia esperada
2: Distribución Chi-cuadrado con  grados de libertad,
=(No filas - 1)(No columnas – 1)
Análisis Factorial
de Correspondencias
Análisis Factorial de Correspondencias
OBJETIVO:
Gráficamente:
Visualizar, mediante proyecciones sobre planos,
las proximidades entre perfiles línea, entre
perfiles columna y entre perfiles línea y perfiles
columna de una tabla de contingencia.
Jean Paul Benzecri
(1932 - )
Análisis Factorial de Correspondencias
LA TABLA DE DATOS:
Variables Cualitativas
Individuos
X1
X2
1

n

Análisis Factorial de Correspondencias
TRANSFORMACIONES INICIALES:
Tabla de contingencia
Frecuencias relativas
…j…
i
…j…
… nij …
ni.
… n.j …
n..
i
… fij …
fi.
… f.j …
1
Análisis Factorial de Correspondencias
TRANSFORMACIONES INICIALES:
Perfiles línea
…j…
Frecuencias relativas
…j…
i
… f ij
f i.
….
… f.j …
i
… fij …
1
1
fi.
Perfiles columna
… f.j …
1
…j…
i
f ij
…
f .i ….
…1…
fi.
1
Análisis Factorial de Correspondencias
TRANSFORMACIONES INICIALES:
Perfiles línea
Perfiles columna
…j…
i
… f ij
f i.
….
… f.j …
Espacio de filas
…j…
1
1
i
f ij
…
….
f .i
…1…
Espacio de columnas
fi.
1
Análisis Factorial de Correspondencias
EL REFERENCIAL:
PROCESO DE DIAGONALIZACIÓN
REPRESENTACIÓN DE FILAS
REPRESENTACIÓN DE COLUMNAS
SE TRATA DE DOS SUBESPACIOS DE MISMA NATURALEZA
REGLAS DE TRANSICIÓN
Análisis Factorial de Correspondencias
EFECTO DE LAS REGLAS DE TRANSICIÓN:
Espacio de filas
Espacio de columnas
REPRESENTACIÓN BIPLOT
Análisis Factorial de Correspondencias
EL REFERENCIAL:
IMPORTANTE: A una tabla de contingencia se asocian dos referenciales.
Uno se obtiene cuando perfiles fila son entendidos como individuos (y
perfiles columna como variables) y la otra cuando perfiles columna son
entendidos como individuos (y perfiles fila como variables). No obstante
esto, se puede demostrar que ambos procesos de diagonalización
producen la misma descomposición de la inercia, y que los espacios
resultantes se encuentran fuertemente relacionados entre sí, por medio de
las llamadas relaciones pseudobaricéntricas. Estas relaciones permiten,
en definitiva, superponer los dos espacios obtenidos.
En cada uno de los espacios se representan distancias Ji–cuadrado.
Análisis Factorial de Correspondencias
REGLAS DE LECTURA E INTERPRETACIÓN:
CALIDAD DE REPRESENTACIÓN
CONTRIBUCIONES
DISTANCIA AL ORIGEN
Perfiles bien representados se observan
siempre alejados del origen del sistema.
Sugerencias Bibliográficas
1.
2.
3.
Daniel W.: Estadística con aplicaciones a las ciencias sociales y a la
educación. McGraw-Hill. Mexico, 19997.
Canavos G.: Probabilidad y Estadística. Aplicaciones y métodos. Mc Graw
Hill. México, 1995.
Hernández–Fernández–Baptista: Metodología de la Investigación. Mc Graw
Hill. México, 1998.