Chi cuadrado y otros tests no paramétricos, 2010

Download Report

Transcript Chi cuadrado y otros tests no paramétricos, 2010

ESTADÍSTICA NO
PARAMÉTRICA
Proporciones
2
Chi-Cuadrado (c )
Mann-Whitney
Kruskal-Wallis
Correlación de Spearman
Tipo de Variables y test a utilizar
Variable Grupos
Test
Intervalar
Intervalar
Intervalar
Dep/Ind
Nominal
Ordinal
Ordinal
Ordinal
Ordinal
Ordinal
Student no pareado
Student pareado
ANOVA/Scheffé/...
Análisis de Reg. / r
Chi cuadrado
Chi cuadrado
Mann-Whitney
Kruskal-Wallis
Wilcoxon
Spearman
2 - ind dif.
2 - mismos ind.
3 ó más grupos
2 grupos
2 grupos
2 grupos
3 grupos
2 g /mismos ind
dep/ind
Tipo de experimento
Dos grupos de
tratamiento
consistentes de
individuos
diferentes
Tres o más
grupos
consistentes
de individuos
diferentes
Antes y
después de un
tratamiento en
los mismos
individuos
Múltiples
tratamientos
en los
mismos
individuos
Asociación
entre dos
variables
Intervalar (y
obtenida de
población con
distribución
normal)*
Test t no pareado
Análisis de
Varianza
Test t pareado
Análisis de
varianza de
medidas
repetidas
Regresión
linear y
correlación de
Pearson;
análisis de
Bland-Altman
Nominal
Chi-cuadrado de
tabla de
contingencia
Chi-cuadrado
de tabla de
contingencia
Test de
McNemar
Q de
Cochrane
Coeficiente de
contingencia
Ordinal
Test de suma de
rangos de MannWhitney
Estadístico de
Kruskal-Wallis
Test del signo
de rangos de
Wilcoxon
Estadístico de
Friedman
Correlación de
rangos de
Spearman
Tiempo de
sobrevida
Test de Gehan ó
Test de rango del
Log
Escala de
medición
* Si los datos no tienen distribución normal, se ordenan y se aplican los tests para variables ordinales
Proporción
• Resumen de variables binarias:
– Síntoma:
– Tratamiento:
Presente / Ausente
Efectivo / Fracaso
• Si r, número de sujetos observados con
la característica, en la muestra n la
proporción será:
– Con la característica p = r / n
– Sin la característica q = 1- p
Intervalo de confianza de una
proporción
se( p) 
p(1  p) / n
IC95%  p  1,96 se( p)
No confía
30.8%
En una clínica dental le
preguntan a 263 pctes si
confían que sus CD tengan
los datos en un PC, 81
dicen que la privacidad se
pierde, el IC 95% es:
Si confía
69.2%
p  81/ 263  0,308
se( p)  0,308(1  0,308) / 263  0,0285
IC95%  0,308 1,96 0,0285 0,252 a 0,364
Tests de proporciones
• Si existe diferencia con una proporción
conocida
• Comparar si existen diferencias
significativas entre dos proporciones no
pareadas
• Comparar si existen diferencias
significativas entre dos proporciones
pareadas
Si existe diferencia con una
proporción conocida
• Similar a lo visto en test t (comparar con
promedio conocido), o sea:
Valor observado - valor esperado
error estándar de valor observado
En una clínica de 215 pctes, 39 (18%) tienen asma, a nivel
nacional se sabe que el asma se presenta en 15%.
¿Existen diferencias significativas, entre 15% y 18%?
z
p  pesp
se( p)
se( p) 
p(1  p)
n
0,15 0,85
se( p) 
 0,0244
215
0,18  0,15
z
 1,23
0,0244
T abla de valoresz (buscar) :1,23 0,2187
A 25 pctes con osteoartrosis cervical se les dividió, al
azar, en dos grupos (Lewith y Machin, 1981):
• 12 fueron tratados con estimulación infra roja (IR).
• 13 recibieron placebo.
9/12 con IR mejoró o desapareció el dolor = 0,75
4/13 en el grupo placebo mejoró =0,31
¿Existen diferencias significativas?
se( p1  p2 )  var(p1 )  var(p2 )
se( p1  p2 ) 
p1 (1  p1 ) p2 (1  p2 )

n1
n2
IC95%  p1  p2  1,96 se( p1  p2 )
En el ejemplo : 0,7500 - 0,3077  0,4423
y el Error estándar es
0,75 0,25 0,3077 0,6923
se( p1  p2 ) 

12
13
se( p1  p2 )  0,1789
IC95%  p1  p2  1,96 0,1789
o sea IC 95%  0,09 a 0,79 Existen dif significativas
Chi cuadrado
Lado del dado
f(0)
f(E)
(0-E)2/E
-------------------------------------------------------------------------------------1
7
10
0,9
2
5
10
2,5
3
15
10
2,5
4
17
10
4,9
5
5
10
2,5
6
11
10
0,1
------------------------------------------------------------------------------------TOTAL
60
60
=13,40 = c
Gl = 6 - 1 = 5
Crític : c 0.05 = 11.07
Rechazar Ho
MEJORA SINTOMAS DEL RESFRIO
NO
SI
VITAMINA C
PLACEBO
75
34
25
63
(O  E ) 2
c 
E
2
2
2
2
(
75

55
,
33
)
(
34

53
,
67
)
(
25

44
,
67
)
(
63

43
,
33
)
c2 



 31,793
55,33
53,67
44,67
43,33
2
c2= 31,793, gl = 1, p<0,0001
Cálculo del test – chi-cuadrado
Mejoran de los síntomas del
resfrío
SI
NO
Total
= 100*109/197
Vitamina C
fo =75
fe =55,33
fo =34
109
fe =53,67
Placebo
fo =25
fe =44,67
fo =63
88
fe =43,33
Total
f columna
100
25
197
= 100*88/197
Cálculo de valores esperados
A
B
C
D
Ea  ( A  B)( A  C ) /( A  B  C  D)
Eb  ( A  B)(B  D) /( A  B  C  D)
Ec  ( A  C )(C  D) /( A  B  C  D)
Ed  ( B  D)(C  D) /( A  B  C  D)
Cálculo de valores esperados
Si
No
Total
Esperados
75
34
109
55,33
53,67
25
63
88
44,67
43,33
100
97
197
(O  E ) 2
c 
E
(75  55,33) 2 (34  53,67) 2 (25  44,67) 2 (63  43,33) 2
2
c 



 31,793
55,33
53,67
44,67
43,33
2
Chi-Square Table
ESTUDIO DE TRES PASTAS DENTALES Y SU EFECTO ANTICÁLCULO
PD Bajo
A
49
B
67
C
49
TOTAL165
E = 100
165 300
E
(55)
(55)
(55)
Moderado E
30 (26)
21 (26)
27 (26)
78
Alto E TOTAL
21 (19)
12 (19)
24 (19)
57
E = 55
c2 = (49 - 55)2/55 + ... + (24 - 19)2/19 = 9,65
gl = (f - 1) (c - 1) = (3 - 1) (3 - 1) = 4
Crítico: c2 0.05 = 9,49. SE RECHAZA HO
100
100
100
300
Chi-Square Table
Chi - cuadrado (c2)
c2 = (O - E)2/E (Chi cuadrado de Pearson)
c = (|O - E|2 - 1/2) / E Corrección de Yates
Corrección de Yates: para tablas 2x2, con
muestras pequeñas (en una celda existen
menos de 5 observaciones).
Tamaño de muestra: n de celdas x 10.
Ej: 2 x 2 = 4 x 10 = 40
Ej. Ant: 3x3 = 9 x 10 = 90
Áreas bajo la curva
Distribución de Chi-Cuadrado
• Supongamos que repetimos
experimento 1000 veces (el de
la Vit C / Placebo). Para cada
experimento calculamos el
valor de Chi-Cuadrado y
ploteamos dichos valores.
• Eje X es el valor calculado de
Chi-cuadrado de acuerdo a la
fórmula.
• Eje Y es el número de veces
que se obtiene el valor de chicuadrado.
ODDS RATIO
• Proporciona:
– Estimado de la relación entre dos variables
binarias (si / no)
– Permite examinar los efectos de otras
variables en dicha relación
– Forma especial y conveniente de
interpretación en estudios caso-control
• “The odds that a single throw of a die
will produce a six are 1 to 5, or 1/5”.
• “ODDS: es la relación de la probabilidad
que el evento de interés ocurra contra
la probabilidad de que esto no ocurra”.
Bland y Altman. The odds ratio, BMJ 320;1468, 2000
Razón de desigualdad
(Odd ratio)
a
ad
c
OR 

b
bc
d
1 1 1 1
SE(loge OR) 
  
a b c d
IC95%OR  1,96 SE(loge OR)
OR = 5,559
IC 95% : 3,00 a 10,29
Si
Si
No
No
75 (a)
34 (b)
25 (c)
63 (d)
a
ad 75 63
c
OR 


 5,559
b
bc 34 25
d
1 1 1 1
SE(loge OR) 
  
a b c d
1
1
1
1
SE(loge OR) 
  
75 25 34 63
SE(loge OR)  0,314035
IC95%OR  expln OR  1,96SE(ln OR)
75 63
OR 
 5,559
34 25
LN (5,559)  1,7154
IC  1,7154 1,96 0,3140
2,3308a 1,100
exp(2,3308), exp(1,100)
IC 95%  10,286 a 3,00
Cases are weighted by the value of variable N.
Frequencies
HACE_EJERC$ (rows) by MEJOR_SINT$ (columns)
Si
No
Total
si
75.000
25.000
100.000
no
34.000
63.000
97.000
Total
109.000
88.000
197.000
Test statistic
Pearson Chi-square
Yates corrected Chi-square
Value
31.793
30.197
Coefficient
Odds Ratio
Ln(Odds)
0.314
Value
5.559
1.715
df
Prob
1.000
1.000
Asymptotic Std Error
OjO: Debe calcular IC 95% = 1.715 ± 1.96 * 0.314
0.000
0.000
Riesgo Relativo
• Relación de frecuencias de dos categorías.
O desigualdad de ser clasificado en la
columna 1 en lugar de la columna 2.
• OR = (A/C) / (B/D)
• >1: personas con factor de riesgo tienen
más probabilidad que presenten el evento.
• <1: personas con factor de riesgo son
menos probable que experimenten el
evento.
Edad Materna y peso al nacer
(Fleiss y col, 3ª. Ed,)
Peso al nacer
<= 2500 g >2500 g
Edad Mat
<= 20 a.
> 20 a.
Total
Total
10
15
40
135
50
150
25
175
200
Existe asociación entre niños de bajo peso al nacer
y edad de la madre?
Odds ratio
(es solamente para estudios caso-control, variables
nominales, tablas 2x2)
(similar a riesgo relativo)
• Si OR >1: existe una asociación positiva entre el
factor de riesgo y el evento.
• Si OR <1: hay una asociación negativa, (presencia
del factor disminuye la probabilidad de encontrar el
evento.
Edad Materna y peso al nacer
(Fleiss y col, 3ª. Ed,)
Peso al nacer
<= 2500 g >2500 g
Edad Mat
<= 20 a.
> 20 a.
Total
Total
10
15
40
135
50
150
25
175
200
n.. (|n11n22 – n12n21| - ½ n..)2
200(|10x135-40x15| -1/2 200)2
c2 = ------------------------------------------ = --------------------------------------------- = 2,58
n1.n2.n.1n.2
50x150x25x175
Edad Materna y peso al nacer
(Fleiss y col, 3ª. Ed,)
Peso al nacer
<= 2500 g >2500 g
Edad Mat
<= 20 a.
> 20 a.
Total
Total
n11
n21
n12
n22
n1.
n2.
n.1
n.2
n..
n.. (|n11n22 – n12n21| - ½ n..)2
200(|10x135-40x15| -1/2 200)2
c2 = ------------------------------------------ = --------------------------------------------- = 2,58
n1.n2.n.1n.2
50x150x25x175
Proporciones
(Fleiss y col, 3ª. Ed,)
Peso al nacer
<= 2500 g
>2500 g
Edad Mat
<= 20 a.
> 20 a.
Total
0,050
0,075
0,125
0,200
0,675
0,875
Total
0,25
0,75
1,00
Edad Materna y peso al nacer
(Fleiss y col, 3ª. Ed,)
Peso al nacer
<= 2500 g >2500 g
Edad Mat
<= 20 a.
> 20 a.
Total
Total
20
30
80
270
100
300
50
350
400
Existe asociación entre niños de bajo peso al nacer
y edad de la madre?
• Sensibilidad: proporción de positivos
que son correctamente identificados por
el test.
• Especificidad: proporción de negativos
que son correctamente identificados por
el test
Comparación de sensibilidad y especificidad vs.
Valores predictivos positivo y negativo para evaluar la
seguridad de tests para diagnóstico
ENFERMEDAD
SI
NO
SI
(a)
Verdad +
45
(b)
Falso +
10
NO
(c)
Falso –
5
(d)
Verdad 40
TEST
Sensibilidad =
Especificidad =
VPP =
VPN =
N = 100
a / a + c = 45 / 50 = 0,90
d / b + d = 40 / 50 = 0,80
a / a + b = 45 / 55 = 0,82
d / c + d = 40 / 45 = 0,89
Comparación de sensibilidad y especificidad vs. Valores
predictivos positivo y negativo para evaluar la seguridad de tests
para diagnóstico
Tomado de Kramer, 1988
ENFERMEDAD
SI
NO
SI
(a)
Verdad +
9
(b)
Falso +
18
NO
(c)
Falso –
1
(d)
Verdad 72
TEST
Sensibilidad =
Especificidad =
VPP =
VPN =
N = 100
a / a + c = 9 / 10 = 0,90
d / b + d = 72 / 90 = 0,80
a / a + b = 9 / 27 = 0,33
d / c + d = 72 / 73 = 0,99
• Valor predictivo positivo (VPP): proporción de
pacientes con resultado de test positivo que
son correctamente diagnosticados.
• Valor predictivo negativo (VPN): proporción
de pacientes con resultado de test negativo
que son correctamente diagnosticados.
Tests no paramétricos para dos o
más muestras
Equivalente a test t pareado: Wilcoxon
Equivalente a test t no pareado: Mann-Whitney
Equivalente a ANOVA: Kruskal Wallis
Utilizar con variables ordinales o cuando
variables intervalares no presenten
distribución normal
Test U de Mann-Whitney
• Colocar rangos a las observaciones en
orden de menor a mayor
Test de Mann-Whitney
Producción de orina diaria mL/día.
Placebo
Rango
Droga
Rango
-----------------------------------------------------------------------1000
1
1400
6
1380
5
1600
7
1200
3
1180
2
1220
4
T=
9
19
-------------------------------------------------------------------------Mann-Whitney U= 3,
p = 0.289
Test de Tukey-Duckworth
• Cálculos se pueden hacer en la cabeza
• Existe solamente un requisito que
cumplir:
4 ≤ n1 ≤ n2 ≤ 30
• Ho: Las muestras son idénticas
• Ha: Las muestras son diferentes
• El test estadístico a calcular es C
Test de Tukey-Duckworth
• Existen solamente dos valores críticos:
C0,05 = 7
C0,01 = 10
Test de Tukey-Duckworth
Procedimiento
1. Determine medición más grande y más
pequeña en cada muestra ranqueada.
2. En la muestra que contiene el valor
más grande de todos los valores
combinados, cuente todos los valores
que son mayores que la medición más
grande en el otro grupo.
3. En la otra muestra, cuente todas las
mediciones que son más pequeñas que
la medición más pequeña del grupo de
la primera medición.
4. Sume ambas cantidades (= C).
Grupo1
80
81
82
83
84
85
86
87
89
92
93
94
96
97
98
Grupo2
84
89
92
92
92
94
95
96
96
96
98
98
99
101
103
Valores de
exclusión
Mayor valor
Ccalc = 4 + 3 = 7 C0,05 = 7
Ccalc ≥ C0,05 por lo tanto se rechaza Ho.
Conclusión: las muestras son diferentes
Kruskal-Wallis
• Equivalente a Anova
• Extensión del test de Mann-Whitney a más
de dos grupos
• Al conjunto de observaciones (N) se les da
rango (1 a N), indiferente de qué grupo estén,
y para cada grupo se calcula la suma de
rangos, y posteriormente se calcula H,
definido por
H
12 ni ( Ri  R)
2
N ( N  1)
Donde R es el promedio de todos los rangos, y
es siempre igual a (N+1)/2. Ri = es la suma de
los rangos de ni observaciones.
Para calcular es más fácil:
2
i
R
12
H
 3( N  1)

N ( N  1)
ni
% de reducción de cefalea en
tres grupos (Fentress et al, 1986)
(Rangos en paréntesis)
Relajación y biofeedback
62
(11)
74
( 8,5)
86
( 7)
74
( 8,5)
91
( 6)
37
(14)
 rango
Rango medio
55
9,17
Relajación
69 (10)
43 (13)
100 ( 2)
94 ( 5)
100 ( 2)
98 ( 4)
36
6,00
No tratados
50 (12)
-120 (17)
100 ( 2)
-288 (18)
4 (15)
-76 (16)
80
13,33
2
i
R
12
H
 3( N  1)

N ( N  1)
ni
2
2
2

12 55 36 80 

  3 19  5,69
H


1819  6
6
6 
Gl = GRUPOS – 1 = 2
Valor crítico: tabla de c = 5,99
Se acepta Ho.
Sicólogo, 1863 - 1945
Correlación de Spearman
• Medida No
Paramétrica para
establecer relación
de dos variables
ordinales (ó
intervalares sin DN)
Ventajas:
- No se necesita
distribución normal
- No se ve tan
afectada por
“outliers”
Correlación de Spearman
• Correlación para variables ordinales
• Para determinar la significancia de la
asociación de dos variables continuas
en que no existe normalidad de las
variables.
• Contrapartida no paramétrica de la
correlación de Pearson.
rs  1 
rs  1 
6 ( xi  yi )
n(n  1)
2
6 d
2
n n
3
(n: número de pares de obs.)
(d= dif de rangos)
2
Grado de reabsorción ósea en mandíbula, lado
der e izq. Existe relación ?
Derecha (x) 83 97 91 72 76 88 95 89 75 74
Rango
5 10 8 1 4 6 9
7 3
2
----------------------------------------Izquierda(y) 87 98 84 82 74 92 91 83 80 77
Rango
7 10 6 4 1 9 8 5
3
2
----------------------------------------Dif. de rangos: -2
0
2 -3
3
(x – y)
d2 =
4
0
4
9
9
 d2
=
40
rs = 1 – [ 6(40) / 10(102 – 1)] = 0,757
-3
1
2
0
0
9
1
4
0
0
Diferentes escalas, diferentes
medidas de su asociación
Escala de ambas
variables
Nominal
Medida de
asociación
Chi-Square de
Pearson: χ2
Ordinal
rho de Spearman
Intervalar
r de Pearson
Resumen
• Método de investigación
– Protocolo
– Artículo científico
• Bioestadística
– Estadística descriptiva: n, %, x ± ds
– Inferencia estadística: test t, ANOVA, ARS,
RL, c2