Transcript Document

IUOG, Seminario de Metodología, 28 marzo 2006
Nociones básicas de
métodos cuantitativos
para lingüistas
Cristóbal Lozano
Universidad Autónoma de Madrid
http://www.uam.es/cristobal.lozano
1
Objetivos del seminario

NO estudiaremos hoy:




Cómo hacer estadística.
Cómo diseñar un experimento.
Cómo analizar datos en SPSS.
SÍ estudiaremos hoy:


Conceptos y métodos básicos en investigación
cuantitativa.
Principios básicos antes de comenzar estudio
cuantitativo  qué hay que tener en cuenta.
2
Escoger tema de investigación


Error del principiante: investigarlo “todo”
Solución  restringir el objeto de estudio


ERROR: quiero investigar la adquisición de pronombres en
español L1
SOLUCIÓN: restringir:
 Pronombres personales: caso
 Pronombres personales accusativo: persona
 Pronombres personales acusativo 3ª: singular vs. plural.
►PREGUNTA ¿Necesitamos restringir estos temas de investigación?:
• Adquisición: El “periodo crítico” en la adquisición de español L2.
• Psicolingüística: La representación mental de los morfemas en pacientes con síndrome de
Alzheimer.
• Corpus: la distribución de los sujetos postverbales con verbos inacusativos en dos corpus
nativos: corpus español de la RAE y el British National Corpus.
3
Datos: Tipos

¿Qué/cómo son los datos lingüísticos?









Sintagmas
Palabras
Tiempo de reacción ante ciertas estructuras
Nº de sujetos nulos
Morfemas
Grado de aceptabilidad ante una estructura/elemento.
Edad de aprendizaje de L2
Nivel de competencia gramatical
Tipos de datos:

Cualitativos:

Nominales: cada dato es una etiqueta, un nombre, sin valor numérico real:




Ordinales: cada dato está ordenado según un criterio (mayormenor):



SN / SV.
Hombre/mujer.
L1 inglés / L1 español.
Clase social (baja/media/alta)
Tipología (S>OD>OI)
Cuantitativos:

Continuos: cada dato es un número resultado de una medida, no hay “saltos”.



Milisegundos
Edad cronológica (en meses)
Discretos: cada dato es un número resultado de contar (¿cuántas veces tanto?), hay
“saltos”


Nº de SN en un corpus
Nº de producción de morfemas verbales
4
Medición de datos: escalas

Según el tipo de datos, así el aparato de medición (escala):
IMPORTANTE: El tipo de estadística variará según el tipo de datos/escalas.

Escala nominal:





Escala ordinal:




Competencia (principiante/intermedio/avanzado)
Edad (niño/adolescente/adulto)
Valores de una escala graduada (nunca/a veces/a menudo/siempre)
Escala numérica (intervalo): contínuo, no hay “cero”:







Sexo (hombre/mujer)
L1 (español/chino/japonés)
Respuesta escogida (gramatical/agramatical/no sé)
RT msecs: Tiempo de reacción en milisegundos.
Tiempo (segs) en producir una oración.
TTR (Type/Token ratio)
MLU (Mean Length of Utterance)
Edad cronológica en años: 1, 2, 3, 4, …
Valores de una escala numérica de aceptabilidad del 1 al 10.
Escala numérica (ratio): discreto, hay “cero”:



Nº de SP en un texto.
Nº de errores cometidos con morfemas nominales flexivos.
Nº de africadas en un diálogo.
5
Datos: Población, muestra, caso

Población:





Muestra:






Un conjunto (elegido al azar) de la población que
investigamos.
Debe ser finito.
Más manejable.
Ej 1: un grupo de niños (n=30) con español L1.
Ej 2: un corpus del español (n=1 millón de palabras).
Población
oo o o oo o o o
o o o oo o ooo
o oooo o o o
ooo o o o oo
ooo o o oo o ooo
o o o o o o o ooo
ooo o o oo ooo
o o o o o o oo


Un elemento de la muestra.
Ej 1: uno de los 30 niños de la muestra.
Ej 1: una de las miles de estructuras sintácticas del
corpus.
se extrae
Muestra
Caso:


Nº relativamente grande de elementos (puede ser
infinito).
Poco manejable.
Ej 1: niños que aprenden español L1.
Ej 2: la lengua española (=todas las posibles
oraciones del español)
se infiere
o o
o oo oo
oo
o o
Idea básica:


La muestra representa fielmente a la población.
CIENCIA: se generalizan (=inferencia) los
resultados de la muestra a la población en general.
6
Variables


►¿Qué es una var? ¿Es importante para la investigación?
Variable:



Propiedad/aspecto que varía entre las personas/animales/objetos o cualquier otra
unidad de análisis.
Su valor depende del azar (aleatorio).
Existen Modelos de Probabilidad que describen el comportamiento de las vars, p. ej.,
Modelo distribución Normal, distribución Chi-cuadrado, distribución t, distrib Binominal,
etc.



Longitud corporal, peso de los gatos, talla del pie, número de infracciones de tráfico, sexo
(hombre/mujer), clase social, nº de SSNN en un texto, nº de errores cometidos en L2, etc.
Variable Independiente (VI): variable “predictora”, la manipula el investigador, predice
lo que le ocurrirá a una segunda variable que depende de ella. [predictor, factor]
Variable Dependiente (VD): variable de “respuesta”, el resultado, lo que se mide.
►EJEMPLO: adquisición: El investigador quiere descubrir si el nivel de proficiencia en L2
(Principiante vs. Avanzado) influye en la detección de errores de concordancia Sujeto-Verbo
(*Pedro comes manzanas).
•VI: nivel de competencia (principiante/avanzado)
•VD: nº de detecciones de errores de concordancia Sujeto-Verbo
►PREGUNTA ¿Cuál es la VD y la VI?:
• Adquisición: El inglés es una lengua con sujetos obligatorios (*John believes that is intelligent),
7
al igual que el francés pero a diferencia del español. El investigador predice que en la adquisición
de inglés L2, nivel principiante, los francófonos producirán menos errores que los hispanófonos.
Niveles de la VI

Niveles de la VI:




Competencia: principiante/intermedio/avanzado [3 niveles]
Sexo: hombre/mujer [2 niveles]
Lengua materna: español/japonés/chino [3 niveles]
Modalidad del estímulo: auditivo/visual [2 niveles]
►PREGUNTA ¿Cuál es la VD y la VI? ¿Cuántos niveles de la VI?
• Adquisición: Ionin & Wexler (2002:95): Adquisición de morfología verbal en inglés L1 con
verbos temáticos (no acescenso) vs. verbo “be” (ascenso): “A grammaticality judgement task of
English tense/agreement morphology similarly shows that the child L2 English learners are
significantly more sensitive to the “be” paradigm than to inflection on thematic verbs”.
•VI: flexión verbal: verbo temático vs. verbo “be” (2 niveles)
•VD: resultados (=puntuación) obtenidos en el juicio de gramaticalidad.
►PREGUNTA ¿Cuál es la VD y la VI? ¿Cuántos niveles de la VI?
• Psicolingüística: El investigador quiere saber el tiempo que se tarda (en milisegundos) en
8
reaccionar a una violación sintáctica (ascenso verbal: *John eats often pasta) frente a una oración
gramatical (no ascenso verbal: John often eats pasta).
“Confounding” variables


Hay que controlar las variables que dan lugar a
confusión.
El investigador quiere que los resultados (VD) se
expliquen por una causa específica que se ha
controlado (VI) y no por otras causas irrelevantes.
►EJEMPLO: adquisición: Violaciones en la extracción de elementos wh- en inglés L2: *Who do
you say that killed the president?
3 grupos de aprendices de inglés L2:
•Nativos de alemán (nivel principiante)
•Nativos de griego (nivel principiante)
•Nativos de griego (nivel avanzado)
Problema: ¿A qué se deben los resultados? ¿Al nivel: principiante vs. avanzado? ¿O a la lengua
materna: griego vs. alemán).
Solución:
VI: lengua materna (alemán/griego)
Descartar variable de confusión: nivel avanzado (griego).
9
Constantes

Las posibles variables de confusión hay que
mantenerlas constantes (=una constante no
varía, permanece fija, así que NO es una
var).
►EJEMPLO ANTERIOR: Violaciones en la extracción de elementos wh- en inglés L2: *Who do
you say that killed the president?
Solución:
VI: lengua materna (alemán/griego)
Constante: nivel (avanzado sólo)
Constante: edad (sólo adolescentes)
Constante: tipo de instrucción (sólo contextos naturalistas)
10
Modelo “Normal”

Es un modelo matemático que
describe la probabilidad de variables
continuas en una Población.
La “Normal” (=campana de Gauss):




Media esperanza (μ) en torno a la
que se centran los datos.
Desviación típica (σ): dispersión de
los datos.
Frecuencia densidad: mientras
más a la izquierda/derecha de la
media, menos frecuencia.
Es muy frecuente en la naturaleza.







N (μ,σ)
Altura de humanos
Peso de gatos
Resistencia del hormigón
Élitros (=alas) de insectos
Capa de óxido de un microchip
Definición: N (μ,σ)
Modelo matemático (con fórmula).
Frecuencia

σ
μ
x
N (0,1) 
/ n
11
Modelo “Normal” (cont)
Se
puede calcular la probabilidad (o el %) de datos que queda a la derecha/izquierda de μ.
Frecuencia
N (μ,σ)
68%
95%
99%
68% de los datos: (μ –1σ, μ +1σ)
95% de los datos: (μ –2σ, μ +2σ)
99% de los datos: (μ –3σ, μ +3σ)
12
La Normal: Población (curva) vs. muestra
(barras de histograma)
n=20
n=10
6
n=50
6
5
15
5
12
3
Frecuencia
4
Frecuencia
Frecuencia
4
3
9
6
2
2
1
1
3
Mean = 6.5607
Std. Dev. = 0.97628
N = 10
0
Mean = 6.9272
Std. Dev. = 0.98329
N = 20
0
1
2
3
4
5
6
7
8
9
10
Mean = 6.9086
Std. Dev. = 1.01983
N = 50
0
1
2
3
4
5
N7_1
6
7
8
9
10
1
2
3
4
5
N7_1
n=100
n=500
12
6
7
8
9
10
N7_1
70
n=1000
100
60
10
80
50
6
Frecuencia
Frecuencia
Frecuencia
8
40
30
60
40
4
20
20
2
10
Mean = 7.1685
Std. Dev. = 0.93642
N = 100
0
Mean = 6.9972
Std. Dev. = 0.96272
N = 500
0
1
2
3
4
5
6
7
8
9
10
Mean = 7.0536
Std. Dev. = 1.00112
N = 1,000
0
1
2
3
4
5
6
7
8
9
10
1
2
3
4
5
6
7
8
9
10
13
Hipótesis




Son predicciones que se aceptarán o rechazarán DESPUÉS del
análisis de datos.
Hipótesis nula (H0): hipótesis por defecto, no predice diferencias,
X=Y, la VI no influye.
Hipótesis alternativa (H1): predice diferencias, X≠Y, causadas por
la VI.
Idea básica:




Rechazar H0 para así poder aceptar H1 (con un margen de confianza alto).
Así, el investigador tentrá la certeza (con un margen de error bajo) de que los
resultados se deben a manipulación de IV (lengua materna) y no a otros factores
o al azar.
¿Por qué margen de error? Porque trabajamos sobre la muestra, que es un
conjunto incompleto de la población.
Idea “matemática”:


H0: μx = μy
H1: μx ≠ μy
►EJEMPLO ANTERIOR: Violaciones en la extracción de elementos wh- en inglés L2: *Who do
you say that killed the president?
H0: No se observarán diferencias entre ambos grupos de principiantes (griego vs. alemán) en el nº
de detecciones de violaciones –wh.
14
H1: Habrá una diferencia entre los dos grupos de principiantes (griego vs. alemán) en el nº de
detecciones de violaciones de elementos –wh.
Dirección de las hipótesis

Ejemplo anterior: hipótesis bidireccional
(=dos colas):


Grupo alemán > grupo griego
Grupo alemán < grupo griego


Posibilidad de cometer error en predicción es doble.
Hipótesis unidireccional (=una cola):

Grupo alemán > grupo griego

Posibilidad de cometer error en predicción es la mitad
(α/2).
►EJEMPLO : Corpus: material sintáctico que interviene entre el Verbo y el Sujeto postverbal: V
X S.
Basándose en teorías lingüísticas, el investigador asume que la proporción de material sintáctico
será mayor en un corpus nativo de español que en otro de italiano.
15
¿Cuáles son H0 y H1 ? ¿Unidireccional o bidireccional?
3 diseños experimentales básicos


Diseño: cómo se interrelacionan los grupos de datos y las variables.
3 tipos de preguntas/hipótesis básicas en cualquier ciencia:




¿Hay diferencias entre varX y varY?
¿Hay diferencias entre varX y varY?
¿Existe una relación entre varX y varY?
3 tipos de diseños básicos:

Inter-grupos [between-group design, unrelated design]: Se comparan dos
grupos diferentes de sujetos/muestras:


Intra-grupos [within-group design, related design]: Se comparan dos elementos
del mismo grupo/muestra:


Psicolingüística: Los inmigrantes con árabe L1 que llegan a España antes del periodo
crítico (14 años) alcanzan un nivel de competencia mayor que aquellos que llegan
después del periodo crítico  2 GRUPOS DIFERENTES (PREPUBESCENTE vs
POSTPUBESCENTE)
Psicolingüística: Los inmigrantes con árabe L1 que llegan a España después del
periodo crítico producen más regularizaciones morfológicas con participios de la tercera
conjugación (*escribido) que con los de la segunda (*ponido)  1 GRUPO, MISMOS
SUJETOS, SE TOMAN MUESTRAS REPETIDAS.
Correlacional: relación entre dos variables:

Psicolingüística: El nivel de competencia lingüístico disminuye conforme la edad de
llegada al país de destino aumenta (=a más edad, menos competencia).  RELACIÓN
ENTRE 2 VAR (EDAD Y COMPETENCIA)
16
Ejemplo:
inter-grupos vs. intra-grupos

Ascenso verbal en inglés L2:



2 grupos:



SAVO: John often eats pasta.
SVAO: *John eats often pasta
Francés
Chino
Método: juicios de aceptabilidad: escala del 0 (inaceptable) al 10 (aceptable).
Inter grupos
French #1
French #2
French #3
French #4
French #5
Chinese #1
Chinese #2
Chinese #3
Chinese #4
Chinese #5

*SVAO
8
10
7
5
7
6
3
2
2
4
Intra grupo
French
French
French
French
French
#1
#2
#3
#4
#5
SAVO
9
8
8
9
10
*SVAO
8
9
7
5
7
¿Cuál podría ser H1? ¿Y H0? ¿Cuál es la VI? Y la ¿VD? ¿Cuántos niveles tiene
VI? Observando a simple vista los datos, ¿podemos rechazar H0?
17
Ejemplo: correlacional


Español L1
Producción de dos elementos:



Flexión con verbos finitos (limpio, limpias, limpia) vs. formas verbales por
defecto (“limpá”)
Sujetos pronominales plenos (yo, tú, él) vs. nulos (pro)
Predicción: H1: la producción de flexión verbal se correlaciona con la
producción de sujetos plenos  a más flexión verbal, menos sujetos
nulos.
M onth/ age of
sampling
mar
apr
may
jun
jul
aug
sep
oct
nov
dec
P roduction of
finite verbal
inflection (% )
P roduction of null
subjects (% )
10
21
38
50
69
77
91
95
96
99
92
84
75
52
32
25
15
12
3
2
18
2 tipos de estadística

Estadística descriptiva:



Describe la muestra.
Proporciona un “resumen” de los datos de la muestra:
 Centralidad: ¿qué datos son los más representativos?
 Frecuencia: ¿cuántas veces aparece X?
 Dispersión: ¿cuán dispersos son los datos?
Estadística inferencial:


Basándonos en la muestra, se infiere algo sobre la
población.
Dice si las diferencias o las correlaciones entre las VI son
significativas.
19
Descriptiva: tendencias de
centralidad

Centralidad: información sobre el
comportamiento más típico de los casos.



Media: (promedio): la suma de todos los valores
observados divididos por el nº de datos.
Moda: valor más frecuente (puede haber más de
una moda).
Mediana: valor que divide la muestra en dos
grupos (la mitad está por debajo de la mediana,
la otra mitad por encima).
20
Ejemplo centralidad

Investigador: quiere comprobar una teoría lingüística (Hipótesis
Incusativa).

Hipótesis Inacusativa:



Contextos neutros: la info es desconocida y ningún constituyente es Foco
(info nueva):




Inergativos como ‘llorar’: SV
Inacusativos como ‘venir’: VS
A:
B:
B’:
¿Qué pasó?
Un niño vino (SV) / Vino un niño (VS)
Un niño lloró (SV) / Lloró un niño (VS)
Método: Test de juicios de aceptabilidad pareados:

Ayer, mientras estabas en el banco, un ladrón entró a robar. Hoy, tu amigo
José ha escuchado en la radio una noticia sobre el banco, pero no sabe qué
paso. Así que José te llama por teléfono y te pregunta: “¿Qué pasó ayer en
el banco?”. Tú respondes:


Un ladrón entró
Entró un ladrón
-2 -1 0 +1 +2
-2 -1 0 +1 +2
21
Estímulos de condición
Inacusativo VS
(n=6)
Datos:
Nativos español
Casos
(n=19)
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
1
0
2
0
2
1
2
2
2
-2
1
0
2
2
2
2
1
1
2
Unacc Neutral: VS
1.00
1.67
2.00
0.17
2.00
1.67
1.33
1.67
2.00
0.00
1.33
1.17
1.83
1.33
1.50
2.00
0.33
1.17
1.33
1.16 1.74 1.95 0.84 1.16 1.21
1.34
1
2
2
0
2
1
2
2
2
2
2
2
2
2
1
2
-2
-1
-2
Media total para estímulo 1
de condición Inacusativo
VS
1
2
2
-1
2
2
2
2
2
2
2
2
2
2
1
2
2
2
2
Media para cada sujeto
de estímulos de
condición Inacusativo
VS
(n=6)
1
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
1
2
2
-1
2
2
-2
1
2
-2
-1
1
1
2
2
2
-2
2
2
1
2
2
1
2
2
2
1
2
-2
2
0
2
-2
1
2
1
1
2
1
2
-1
0
-2
2
-2
1
1
2
1
2
2
-2
1
0
0
-1
-2
Unacc Neutral: !SV
0.50
0.33
-0.83
0.83
-1.83
1.50
-0.50
1.33
0.83
1.83
0.17
1.17
1.33
-0.67
1.50
0.67
-0.83
-0.50
-1.33
0.11 0.11 0.11 0.53 0.63 0.26
0.29
0
-2
-1
2
-2
0
-1
1
0
2
1
0
-1
-2
2
1
-2
2
2
1
0
-1
2
-2
2
-2
1
1
2
-1
0
1
-2
2
1
-1
0
-2
0
1
-2
0
-2
2
-2
1
1
1
-1
1
2
2
1
1
-1
-1
-2
Media total para los 6
estímulos de condición
Inacusativo VS para todos
los casos
0
1
1
-1
-1
1
2
2
1
2
2
2
2
-2
1
0
0
-1
-2
1
0
-1
2
-2
2
2
2
1
2
-1
2
2
2
2
1
-1
-2
-2
Inacusativos VS: 1.34
Inacusativos SV: 0.29
Hay diferencia…pero, ¿con qué confianza
podemos afirmar que son realmente
diferentes? ¿Qué pasaría si replicásemos
22
el experimento 100 veces?
¿Qué hacer con los datos?

1º. Explorar y resumir [estadística descriptiva]:



2º. Inferir y generalizar [estadística inferencial]





Tablas (detallado pero poco intuitivo)
Gráficos (menos detallado pero visualmente intuitivo)
Test(s) relevante(s): t-test, chi-cuadrado, ANOVA, etc…
Comprobar si las diferencias son significativas (o no).
Ver si H0 es rechazada o aceptada.
Generalizar/inferir de la muestra a la población.
3º. Interpretar

Implicaciones teóricas/lingüísticas
23
Frecuencias (absolutas):
tablas
Unacc Neutral: !SVa
Unacc Neutral: VSa
Válidos
Válidos
.00
.17
.33
1.00
1.17
1.33
1.50
1.67
1.83
2.00
Total
Frecuencia
1
1
1
1
2
4
1
3
1
4
19
a. group = Spa nat
-1.83
-1.33
-.83
-.67
-.50
.17
.33
.50
.67
.83
1.17
1.33
1.50
1.83
Total
Frecuenci a
1
1
2
1
2
1
1
1
1
2
1
2
2
1
19
a. group = Spa nat
24
Descriptivos: tablas
Estadísticos
N
Media
Mediana
Moda
Desv. típ.
Unacc
Neutral: VS
19
1.3421
1.3333
1.33a
.60978
Unacc
Neutral: ! SV
19
.2895
.5000
-.83a
1.07704
a. Existen varias modas. Se mostrará el
menor de los valores.
25
Descriptivos:
medias
sumatoriode datos  xi
x

nº datos
n
Hay diferencia… pero
¿con qué confianza
podemos decir que la
diferencia es real?
¿Podemos rechazar H0
(para aceptar H1)?
2
Mean acceptability rate

1.34
1
0
0.29
Unac Neut VS
Unac Neut #SV
-1
-2
Natives
26
Descriptiva: dispersión

Desviación típica [inglés standard deviation]




( xi  x )
sumatoriode residuos
s

nº datos
n
La desviación de los datos con respecto a la media.
Desviación típica baja: datos homogéneos.
Desviación típica alta: datos heterogéneos.
 Inacusativos VS: 0.61
 Inacusativos SV: 1.08
Rango: diferencia entre valor más alto y más bajo.


Inacusativos VS: valor más bajo (0), valor más alto (+2) 
rango: 2
Inacusativos SV: valor más bajo (-1.83), valor más alto
(+1.83)  rango: 3.66
27
Histograma
Histograma
group= Spa nat
group= Spa nat
5
5
4
4
Frecuencia
Frecuencia
Descriptiva: frecuencias y
dispersión [histograma]
3
2
1
3
2
1
Mean = 1.3421
Std. Dev. = 0.60978
N = 19
0
-2
-1
0
Unacc Neutral: VS
1
2
Mean = 0.2895
Std. Dev. = 1.07704
N = 19
0
-2.00
-1.00
0.00
1.00
2.00
Unacc Neutral: !SV
28
Descriptiva: centralidad y
dispersión [diagrama de cajas]
group: Spa nat
group: Spa nat
Unacc Neutral: VS
Unacc Neutral: !SV
10 4
-2
-1
0
1
2
-2.00
-1.00
0.00
1.00
2.00
29
Inferencial: Nivel de significación

¿Con qué margen de confianza podemos rechazar H0 (para así aceptar H1)?

Investigador establece el nivel de significación α:



α=0.05  posibilidad de error del 5% (confianza del 95%) lingüística, psicología
α=0.01  posibilidad de error del 1% (confianza del 99%) medicina, farmacología
El test estadístico (SPSS) arroja el valor p, que varía entre 0 y 1.

p=0.03 implica:







La probabilidad matemática (de 0 a 1) de que H0 sea cierta: 0.03 = 3%.
Podemos rechazar H0 con una confianza de p=0.97 = 97%.
La diferencia (o correlación) entre X e Y es estadísticamente sig porque p<α.
La probabilidad de que la diferencia (o correlación) se deba al azar es 3%.
Podemos estar 97% seguros de que nuestros resultados no se deben al azar.
Podemos estar 97% seguros de que la diferencia (o correlación) de nuestra muestra se
puede aplicar a la población en general.
p=0.60 implica:






La probabilidad matemática (de 0 a 1) de que H0 sea cierta: 0.60 = 60%.
Podemos rechazar H0 con una confianza del p=0.40= 40%.
La diferencia (o correlación) entre X e Y NO es estadísticamente sig porque p>α.
La probabilidad de que la diferencia (o correlación) se deba al azar es 60%.
Podemos estar 40% seguros de que nuestros resultados no se deben al azar.
Podemos estar 40% seguros de que la diferencia (o correlación) de nuestra muestra se
puede aplicar a la población en general.
30
RESUMEN:
p<0.05 diferencias sig
p>0.05 diferencias n.s.
Asociación: Correlación


Correlación: mide el grado de relación entre dos variables: X e Y.
Covarianza: mide relación lineal entre X e Y.
COV ( X , Y ) 

sumatorioresiduos X por residuos Y

nº datos
i
 x)( yi  y)
n
Coeficiente de correlación r

covarianzade (X, Y)
COV ( X , Y )

desv típicaX por desv típicaY
sx s y

Medición de vars: escála numérica.
 Datos cuantitativos

Correlación positiva:
 Mientras más A, más B.


 (x
A más horas de instrucción en una L2, más nivel de competencia.
Correlación negativa:
 Mientras más A, menos B.

Mientras más tarde se aprenda una L2, menor será el nivel de
competencia.
31
Correlación: gráfico de dispersión
32
Ejemplo: correlación



Vida cotidiana: a más altura, más peso.
Adquisición: Español L1, Inglés L2
H1: a más producción de concordancia S-V
(walk-s, sing-s), más producción de
pronombres plenos (he walks, she sings).
Learner
#1
#2
#3
#4
#5
#6
#7
#8
#9
#10
P roduction of overt
pronominal subjects
(% )
P roduction of
finite inflection -s
(% )
70
90
73
48
48
20
22
8
7
7
80
84
75
52
32
25
25
12
3
2
33
Ejemplo (cont)
100
80
80
60
60
40
40
PRONOUN
100
20
0
0
20
40
60
80
20
0
0
100
S
S
20
40
60
80
100
r=0.972
Correlations
PRONOUN
S
Pearson Correlation
Sig. (1-tailed)
N
Pearson Correlation
Sig. (1-tailed)
N
PRONOUN
1
.
10
.972**
.000
10
**. Correlation is significant at the 0.01 level (1-tailed).
S
.972**
.000
10
1
.
10
p<0.01
(una cola)
34
Correlación ≠ causalidad
Asociación: Chi cuadrado χ2


Mide la asociación/relación entre dos var nominales.
Compara las frecuencias observadas con el
modelo teórico-matemático “Chi cuadrado”
(=frecuencias esperadas).
(freqobservadas- esperadas)2
(O - E)2
 

freq esperadas
E
2

Medición: escala nominal (datos cualitativos):





sí/no
SN/SV/SP
nunca/a veces/siempre
L1 inglés / L1 alemán
Cada caso (=persona) es contado sólo 1 vez.
35
Ejemplo chi cuadrado




Investigador: relación/asociación entre…?
 Lengua materna (L1): holandés / griego
 Nivel de pronunciación en L2: suena como un nativo / NO suena
como un nativo
Hipótesis de trabajo: ¿Está la lengua materna asociada al nivel
de pronunciación en L2? SÍ. Por ejemplo, si la L1 y la L2 son
fonológicamente similares, el nivel de pronunciación en L2 será
mayor.
H1: hay diferencias entre L1 holandés y L1 griego. En concreto,
la proporción aprendices clasificados como “suena nativo” será
significativamente más alta en el grupo holandés que en el
griego.
Método: fonólogo evalúa como nativo/no nativo grabaciones
orales de los aprendices.
36
Datos chi-cuadrado
37
Resultados chi-cuadrado
GROUP * ATTAINME Crosstabulation
Count
GROUP
Dutch
Greek
Total
ATTAINME
Non
Native-like
native-like
18
7
6
15
24
22
p=0.003 (dos colas)
p=0.003/2 (una cola)
Total
25
21
46
Chi-Square Tests
18 holandeses
fueron
clasificados
como “nativo”
Pearson Chi-Square
Continuity Correction
Likelihood Ratio
Fisher's Exact Test
Linear-by-Linear
Association
N of Valid Cases
a
Value
8.626b
6.974
8.908
df
1
1
1
Asymp. Sig.
(2-sided)
.003
.008
.003
Exact Sig.
(2-sided)
.007
8.439
1
Exact Sig.
(1-sided)
.004
.004
46
a. Computed only for a 2x2 table
b. 0 cells (.0%) have expected count less than 5. The minimum expected count is
10.04.
¿Podemos rechazar H0 (no hay relación entre L1 y nivel de pronunciación)?
P=0.003/2=0.0015 (una cola)
¿Es p menor que α? 0.0015<0.05 SÍ
Entonces, rechazamos H0 y aceptamos H1
Conclusión: existe una relación significativa entre L1 y nivel de pronunciación en L2 …
38
o la L1 influye más en el nivel de pronunciación de L2 mientras más cercanas estén
fonológicamente
Diferencias: test t de Student
x

sˆ / n

Modelo matemático:

Compara si dos medias son significativamente
diferentes.
Tipos:




t n 1
Test t para muestra independientes (inter grupos):
 Dos grupos diferentes, p. ej., L1 griego, L1 español
Test t para muestras relacionadas (intra grupos):
 Un mismo grupo (L1 español) se mide dos veces con
verbos inacusativos: orden SV y luego orden VS.
Medición: escala (datos cuantitativos).
39
Ejemplo t test (intra-grupo)


Ejemplo: un solo grupo (nativos de español)
Se toman medias repetidas:




Inacusativo VS
Inacusativo SV
Hay diferencias entre VS (1.34) y SV (0.29)
Pero, ¿son sig?
VS
Nativos
Mean acceptability rate
2
1.34
1
0
0.29
-1
-2
Natives
1
2
3
4
5
6
7
8
9
Unac Neut VS
10
Unac Neut #SV 11
12
13
14
15
16
17
18
19
1
0
2
0
2
1
2
2
2
-2
1
0
2
2
2
2
1
1
2
Unacc Neutral: VS
1.00
1.67
2.00
0.17
2.00
1.67
1.33
1.67
2.00
0.00
1.33
1.17
1.83
1.33
1.50
2.00
0.33
1.17
1.33
1.16 1.74 1.95 0.84 1.16 1.21
1.34
1
2
2
0
2
1
2
2
2
2
2
2
2
2
1
2
-2
-1
-2
1
2
2
-1
2
2
2
2
2
2
2
2
2
2
1
2
2
2
2
1
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
2
1
2
2
-1
2
2
-2
1
2
-2
-1
1
1
2
2
2
-2
2
2
1
2
2
1
2
2
2
1
2
-2
2
0
2
-2
1
2
1
1
2
0
-2
-1
2
-2
0
-1
1
0
2
1
0
-1
-2
2
1
-2
2
2
1
0
-1
2
-2
2
-2
1
1
2
-1
0
1
-2
2
1
-1
0
-2
SV
0
1
-2
0
-2
2
-2
1
1
1
-1
1
2
2
1
1
-1
-1
-2
0
1
1
-1
-1
1
2
2
1
2
2
2
2
-2
1
0
0
-1
-2
1
0
-1
2
-2
2
2
2
1
2
-1
2
2
2
2
1
-1
-2
-2
1
2
-1
0
-2
2
-2
1
1
2
1
2
2
-2
1
0
0
-1
-2
0.11 0.11 0.11 0.53 0.63 0.26
Unacc Neutral: !SV
0.50
0.33
-0.83
0.83
-1.83
1.50
-0.50
1.33
0.83
1.83
0.17
1.17
1.33
-0.67
1.50
0.67
-0.83
-0.50
-1.33
40
0.29
Resultados test t (intra-grupo)
a
Estadísticos de muestras relacionadas
Par 1
Unacc Neutral: VS
Unacc Neutral: !SV
Media
1.3421
.2895
N
19
19
Desviación
típ.
.60978
1.07704
p=0.003
a. group = Spa nat
Prueba de muestras relacionadasa
Diferencias relacionadas
Media
Par 1
Unacc Neutral: VS Unacc Neutral: !SV
1.05263
Desviación
típ.
1.31240
Error típ. de
la media
.30108
95% Intervalo de
confianza para la
diferencia
Inferior
Superior
.42008
1.68519
t
3.496
gl
Sig. (bilateral)
18
.003
a. group = Spa nat
¿Podemos rechazar H0 (la aceptación de VS y SV no son diferentes)?
p=0.003
¿Es p menor que α? 0.003<0.05 SÍ
Entonces, rechazamos H0 y aceptamos H1
Conclusión: existe una difrencia significativa entre VS y SV, según predice la Hipo.41Inac.
Ejemplo: test t (inter-grupos)


Inacusativos: orden VS
2 grupos:


Nativos de español
Griegos aprendices de español L2 (nivel avanzado bajo)
Griegos
1 1 1 1 1 1 1
2 2 2 2 2 2 0
3 2 2 2 2 2 2
4 0 -1 2 -1 1 0
5 2 2 2 2 2 2
6 1 2 2 2 2 1
7 2 2 2 -2 2 2
8 2 2 2 1 1 2
9 2 2 2 2 2 2
10 2 2 2 -2 -2 -2
11 2 2 2 -1 2 1
12 2 2 2 1 0 0
13 2 2 2 1 2 2
14 2 2 2 2 -2 2
15 1 1 2 2 1 2
16 2 2 2 2 2 2
17 -2 2 2 -2 1 1
18 -1 2 2 2 1 1
19 -2 2 2 2 2 2
1.00
1.67
2.00
0.17
2.00
1.67
1.33
1.67
2.00
0.00
1.33
1.17
1.83
1.33
1.50
2.00
0.33
1.17
1.33
1.34
24
2 1
2
2 2 2
2 1 1
2 2 1
0 1 1
2 2 2
-1 1 2
2 -2 -2
2 2 2
-2 0 -1
2 2 2
2 2 2
2 2 2
1 2 1
-2 2 1
2 2 2
2 2 2
-2 2 2
2 2 1
0 1 0
2 2 2
2 2 2
2 0 1
2 1 1
2
1
1
2.00
1.67
1.67
1.00
2.00
1.33
0.00
2.00
0.00
2.00
2.00
2.00
1.50
0.83
1.50
2.00
1.33
1.50
0.00
2.00
1.83
1.17
1.67
1.50
1.44
Mean acceptability rate
Nativos
1 2 2 2
2 2 2 2
3 1 2 2
4 2 1 1
5 2 2 2
6 2 2 2
7 -2 2 2
8 2 2 2
9 -1 2 2
10 2 2 2
11 2 2 2
12 2 2 2
13 2 2 1
14 1 1 2
15 -1 2 2
16 2 2 2
17 2 2 2
18 1 1 2
19 0 1 -2
20 2 2 2
21 1 2 2
22 2 2 0
23 2 2 2
Unac Neut VS
2
1.44
1.34
1
0
Unac Neut VS
-1
-2
Gk Low adv
Natives
Hay diferencias entre los nativos y
los griegos: 1.34 vs. 1.44
PREGUNTA: ¿Es la diferencia
realmente significativa?
42
Resultados: test t (inter grupos)
Estadísticos de grupo
group
Unacc Neutral: VS Spa nat
Gk Low Adv
N
Media
1.3421
1.4375
19
24
Desviación
típ.
.60978
.64981
Error típ. de
la media
.13989
.13264
p=0.63
Prueba de muestras independientes
Prueba de Levene
para la igualdad de
varianzas
F
Unacc Neutral: VS Se han asumido
varianzas iguales
No se han asumido
varianzas iguales
.092
Sig.
.763
Prueba T para la igualdad de medias
t
gl
Sig. (bilateral)
Diferencia
de medias
Error típ. de
la diferencia
95% Intervalo de
confianza para la
diferencia
Inferior
Superior
-.491
41
.626
-.09539
.19424
-.48768
.29689
-.495
39.762
.623
-.09539
.19278
-.48509
.29430
¿Podemos aceptar H0 (la aceptación de inacusativo VS NO es diferente entre nativos de español
y nativos de griego con español L2)?
p=0.63
¿Es p menor que α? 0.63>0.05 NO
Entonces, NO podemos rechazar H0
Conclusión: NO existe una difrencia significativa en la aceptación de inacusativo43VS
entre españoles y griegos, según predice la Hipo. Inac.
Diagrama de flujo:
¿En qué consiste el estudio?
Spearman rho
(r) coefficient
Correlation
between
scores?
yes
Differences
between
conditions?
Counting
categories?
yes
Chi-square
(χ 2 )
yes
1 IV
how many
conditions/
levels?
2 levels
t-test repeated
measures
(within groups)
2(+) IVs
same or
different
subjects?
3(+) levels
same or
different
subjects?
same
1 IV or 2
(or more)
IVs?
same or
different
subjects?
different
t-test independ.
groups
(between groups)
same
different
1-w ay ANOVA
repeated
measures
(within groups)
1-w ay ANOVA
independent
groups
(between groups)
same
2-w ay ANOVA
repeated
measures
(within groups)
different
2-w ay ANOVA
mixed
2-w ay ANOVA
independent
groups
(between groups)
44
Adapted from Greene and D’Oliveira (1999)
Bibliografía

Brace, N., Kemp, R., Snelgar, R., 2000. SPSS for Psychologists. Basingstoke: Palgrave.

Christie, K. and Lantolf, J. The ontological status of learner grammaticality judgments in UG approaches to L2 acquisition. Rassegna Italiana di Linguistica Applicata 24[3], 31-57. 1992.

Cowart, W., 1997. Experimental syntax: Applying Objective Methods to Sentence Judgments. Thousand Oaks, CA.: Sage.

Crain, S., Thornton, R., 1998. Investigations in Universal Grammar: A guide to Experiments on the Acquisition of Syntax and Semantics. Cambridge, MA.: MIT Press.

Dörnyei, Z., 2003. Questionnaires in Second Language Research: Construction, Administration and Processing. Mahwah, NJ: LEA.

Faer, C and Casper, G. Introspection in Second Language Research. 1987.

Graham, A., 1995. Statistics: An Introduction. London: Hodder & Stoughton.

Greene, J., D'Oliveira, M., 1999. Learning to Use Statistical Tests in Psychology (2nd edition). Buckingham: Open University Press.

Greer, B., Mulhern, G., 2002. Making sense of data and statistics in psychology. Basingstoke: Palgrave.

Mackey, A., Gass, S.M., 2005. Second Language Research: Methodology and Design. Mahwah, NJ: Lawrence Erlbaum.

Mandell, P.B., 1999. On the reliability of grammaticality judgement tests in second language acquisition research. Second Language Research 15, 73-99.

Marinis, T., 2003. Psycholinguistic techniques in second language acquisition research. Second Language Research 19, 144-161.

McDaniel, D, McKee, C, and Cairns, H. S. Methods for assessing children's syntax. 1996. 1998, MIT Press.

Menn, L., Ratner, N.B., 2000. Methods for studying language production. Mahwah, NJ: Lawrence Erlbaum.

Oakes, M.P., 1998. Statistics for Corpus Linguistics. Edinburgh: Edinburgh University Press.

Porte, G.K., 2002. Appraising Research in Second Language Learning: A Practical Approach to Critical Analysis of Quantitative Research. Amsterdam: John Benjamins.

Prideaux, G.D., 1984. Psycholinguistics: The Experimental Study of Language. London: Croom Helm.

Rietveld, T., van Hout, R., 2005. Statistics in Language Research: Analysis of Variance. Mouton de Gruyter.

Scholfield, P., 1995. Quantifying language : a researcher's and teacher's guide to gathering language data and reducing it to figures. Clevedon: Multilingual Matters.

Schütze, C.T., 1996. The Empirical Base of Linguistics: Grammaticality Judgments and Linguistic Methodology. Chicago: The University of Chicago Press.

Seliger, H.W., Shohamy, E., 1989. Second Language Research Methods. Oxford: Oxford University Press.

Sorace, A., 1996. The use of acceptability judgments in second language acquisition research. In: Ritchtie, W.C., Bhatia, T.K. (eds.), Handbook of Second Language Acquisition London: Academic
Press.
45