Análisis estadístico básico: t-test, anova, pruebas no paramétricas, regresión... José Ríos ¿Es cierto el bostezo inducido? José Ríos © IUSC - 2009
Download ReportTranscript Análisis estadístico básico: t-test, anova, pruebas no paramétricas, regresión... José Ríos ¿Es cierto el bostezo inducido? José Ríos © IUSC - 2009
Slide 1
Análisis estadístico básico: t-test,
anova, pruebas no paramétricas,
regresión...
José Ríos
Slide 2
¿Es cierto el bostezo inducido?
José Ríos ©
IUSC - 2009
2
Slide 3
Hoy toca
estadística
José Ríos ©
IUSC - 2009
3
Slide 4
Por que claro… conociendo toda la información
somos capaces de saber como se llega a los
resultados
José Ríos ©
IUSC - 2009
4
Slide 5
Pero antes hablemos de variables…
Tiempo
Presencia
Ocurrencia
No lo consideran
Obligan a determinarlo
Enfermedad
-Prevalencia
-Incidencia
-Estado opinión
Exposición
(población)
Encuestas
-Recurrencia
Densidad de
incidencia
(individuo)
No interesa la evolución temporal
Estudio
José Ríos ©
transversal
longitudinal
IUSC - 2009
5
Slide 6
… y de la importancia metodológica
del tamaño de la muestra
José Ríos ©
IUSC - 2009
6
Slide 7
Resumen de datos
Tres tipos básicos
Posición: también llamadas medidas de tendencia central.
Dispersión: conocidas también como medidas de escala
Forma: sirven para el estudio de la asimetría y
apuntamiento comparado con la curva gaussiana
José Ríos ©
IUSC - 2009
7
Slide 8
Resumen de datos
Medidas de Posición
Media aritmética
xi
X
i 1
n
n
José Ríos ©
En el caso de datos agrupados en intervalos, la
media se calculará con el valor medio de intervalo
Únicamente tiene sentido para variables
cuantitativas
IUSC - 2009
8
Slide 9
Resumen de datos
Medidas de Posición
Mediana
1,3,3,4,6,13,14,14,18
6
1,3,3,4,6,13,14,14,17,18
6 y 13
Mediana=(6+13)/2=9.5
José Ríos ©
Deja a ambos ‘lados’ la misma población.
El valor de la mediana no tiene por que existir en la
muestra
Para su cálculo sólo se requiere que las clases sean
ordenables, podemos, por tanto, calcularla tanto
para variables cuantitativas como cualitativas
ordinales
IUSC - 2009
9
Slide 10
Resumen de datos
Medidas de Posición
Moda
José Ríos ©
Es el valor más frecuente en nuestros datos
En el caso de variables que tomen muchos
valores, el cálculo de la moda es preferible con
los datos agrupados, obtendremos el intervalo
modal
Su cálculo tiene sentido para cualquier tipo de
variable. Sólo usa el valor de las frecuencias
IUSC - 2009
10
Slide 11
Resumen de datos
Medidas de Posición
Cuantiles.
Son de orden (a). Dejan el a 100% de la
población por debajo.
Los percentiles dividen la población en
porcentajes, los terciles, cuartiles y quintiles
fracciones.
El segundo cuartil coincide con la Mediana
José Ríos ©
IUSC - 2009
11
Slide 12
Resumen de datos
Medidas de Posición
Propiedades.
La Media es sensible a los valores extremos, la Mediana
no lo es.
Media 1
Media 2
Nuevo valor en
la muestra
Mediana 1
Mediana 2
José Ríos ©
Especial atención en estudios de análisis de supervivencia
IUSC - 2009
12
Slide 13
¿Pero entonces?
Media
Moda
Mediana
José Ríos ©
IUSC - 2009
13
Slide 14
Resumen de datos
Medidas de Posición
Atención, siempre es mejor ‘visualizar’ los datos antes de
trabajar con ellos.
Es posible que ni la Media ni la Mediana representen bien el
comportamiento ‘central’ de la variable
En este caso, Media y Mediana tienen el mismo valor, ¿algún
comentario?
José Ríos ©
IUSC - 2009
14
Slide 15
Resumen de datos
Medidas Escala (dispersión)
Dos Grandes Familias
Recorridos
Varianzas
José Ríos ©
IUSC - 2009
15
Slide 16
Resumen de datos
Medidas Escala (dispersión)
José Ríos ©
Rangos y amplitudes: valores pequeños en
recorridos o rangos dan idea de poco dispersión,
valores grandes indican mucha dispersión o presencia
de valores extremos.
El Rango (Mín – Máx) se ve extremadamente
afectado por valores extremos, no es, por tanto, una
buena medida.
El recorrido intercualtílico (1er Cuartil – 3er Cuartil)
también indica dispersión.
Ambos valores combinados pueden dar buena idea
de cómo son los datos
IUSC - 2009
16
Slide 17
Resumen de datos
Medidas Escala (dispersión)
Veamos un ejemplo de cálculo
José Ríos ©
IUSC - 2009
17
Slide 18
Resumen de datos
Medidas Escala (dispersión)
¿Qué ocurre si sumamos todas las distancias?
Las distancias negativas son compensadas con las
positivas. La suma es siempre cero
Def.: la media es el centro de gravedad de la distribución
muestral
José Ríos ©
IUSC - 2009
18
Slide 19
Resumen de datos
Medidas Escala (dispersión)
2
José Ríos ©
La varianza es la media
de la suma de las
desviaciones respecto a
la media elevadas al
cuadrado.
La Desviación estandar
es la raíz del anterior
El Coeficiente de
variación usa las
medidas de posición y
escala
1
n
x
n 1
i
2
i 1
2
1
n 1
DE
x
n
i
i 1
1
n 1
2
x
n
i 1
i
2
x *100
CV
IUSC - 2009
19
2
Slide 20
Resumen de datos
Medidas Escala (dispersión)
Pregunta:
¿Por qué si tenemos la varianza acabamos utilizando la
DE? ¿Complicamos los estadísticos inútilmente los
cálculos?
El problema de la varianza es que no se mide en las
mismas unidades que los datos de la muestra, es por
eso que se define la DE
José Ríos ©
IUSC - 2009
20
Slide 21
Resumen de datos
Medidas Escala (dispersión)
Bien.... Pero ¿qué medida es la
buena?
Por si sola ninguna. Siempre es
preferible ver todas ellas, visualizar
los datos siempre ayuda mucho a
detectar posibles problemas en los
datos
Nos podemos ayudar de
Histogramas y Diagramas de cajas
(Box-Plot)
José Ríos ©
IUSC - 2009
21
Slide 22
Resumen de datos
Medidas Escala (dispersión)
El diagrama de caja (Box-Plot),
interpretación:
Nos presenta el Rango y el recorrido
intercuartílico (ojo con el programa utilizado)
Valores fuera de límites son representados con
círculos se consideran ‘normales’
Valores presentados como asterísticos se
podrían estudiar como atípicos
José Ríos ©
OJO CON DESCARTAR ‘ALEGREMENTE’ VALORES
ATÍPICOS
IUSC - 2009
22
Slide 23
Resumen de datos
Medidas Escala (dispersión)
El diagrama de caja (Box-Plot)
Máximo
190
142
141
180
50% de la
muestra
170
Aquí se
espera
encontrar la
mayoría de
la muestra
Mediana
160
150
1
140
Mínimo
130
N=
142
TALLA
José Ríos ©
IUSC - 2009
23
Slide 24
Resumen de datos
Medidas de forma
Medida de asimetría
n
Coef .asimetría
(n 1)(n 2)
( x i x) 3
s
Medida de apuntamiento o kurtosis
n(n + 1)
Kurtosis
(n 1)(n 2)(n 3)
José Ríos ©
( x i x) 4
3(n 1) 2
s
(n 2)(n 3)
IUSC - 2009
24
Slide 25
Resumen de datos
Medidas de forma
Medida de asimetría
Simétrica
Coef.=0
José Ríos ©
Asimétrica positiva
Coef. > 0
IUSC - 2009
Asimétrica negativa
Coef. < 0
25
Slide 26
Descripción gráfica
90
80
70
60
ESPECIE
19
Setosa
50
113
Versico l
Virginic
40
N=
50
50
1
2
50
3
especie
José Ríos ©
Se comparan el largo del sepalo de tres variedades de
lirios: setosa, versicola y virginica
IUSC - 2009
26
Slide 27
Descripción gráfica
Gráfico de dispersión (Scatter Plot)
80
70
60
E SP ECIE
50
Virginic a
Ver s ic o lor
40
Setos a
0
10
20
30
40
50
60
70
Largo pétalo
José Ríos ©
IUSC - 2009
27
Slide 28
Pudiendo resultar útil
setosa
versicolor
virginica
José Ríos ©
IUSC - 2009
28
Slide 29
Descripción gráfica
Una posible evaluación gráfica de los Odds Ratio (OR)
Evento
José Ríos ©
IUSC - 2009
BMI
No
Sí
Odds
OR
<20
6
9
1.50
2.65
(20-25]
23
27
1.17
2.07
(25-30]
30
17
0.57
>=30
9
7
0.78
1.37
29
Slide 30
Estadísitica inferencial
P-valor
Intervalo
de confianza
Paramétricas vs. No paramétricas
Slide 31
Génesis de las ideas
Karl Raimund Popper (1902-1994)
•1934: La lógica de la investigación científica. ¿Cómo
fundamentar el conocimiento científico, por definición
universal y necesario, en la experiencia empírica, por
definición particular?
•Hasta entonces
•Descartes confía en las leyes eternas de la razón
•Hume en las leyes que se extraen de la experiencia
•En contra del positivismo: ¿Cómo realizar una ley universal
a partir de un número particular de experimentos?
•A favor del falibilismo (o falsación): el conocimiento
científico no puede avanzar confirmando nuevas leyes, sino
descartando leyes que contradicen la experiencia.
POR TANTO:
La labor del científico consiste en criticar leyes para ir reduciendo el
número de teorías compatibles con observaciones experimentales.
CONSECUENCIA:
Una proposición científica lo será si es posible crear un experimento
que la pudiese contradecir.
José Ríos ©
IUSC - 2009
31
Slide 32
Pruebas de hipótesis
Unilateral (una cola)
Ho: E - C 0
H 1: E - C > 0
Bilateral (dos colas)
Ho: E - C = 0
H 1: E - C > 0 ó E - C < 0
José Ríos ©
IUSC - 2009
32
Slide 33
¿p?
Probabilidad de observar, por azar, una diferencia
como la de la muestra o mayor, cuando H0 es cierta
Es una medida de la evidencia en contra de la H0
Es el azar una explicación posible de las diferencias
observadas?
Supongamos que así es (H0).
¿Con qué probabilidad observaríamos unas
diferencias de esa magnitud, o incluso mayor? P-
valor
Si P-valor pequeño, rechazamos H0.
¿Difícil?... No, es como un juicio!
José Ríos ©
IUSC - 2009
33
Slide 34
¿p?
Se acepta un valor máximo de 5% (0,05).
Si p0,05 diferencias estadísticamente significativas.
Si p>0,05 diferencias estadísticamente NO
significativas.
NO
implica importancia clínica.
NO
implica magnitud de efecto!!
Influenciada por el tamaño de la muestra. Si n p
José Ríos ©
IUSC - 2009
34
Slide 35
Pero el mío es mejor.
Para un mismo resultado
cuantitativo el
‘investigador avispado’
puede hacer SU
interpretación cualitativa
simplemente inundando el
artículo de valores de p
Misma magnitud de efecto
Misma relevancia clínica
Mayor tamaño de muestra
Menor valor de p
(habitualmente)
¿?
Mayor relevancia clínica
José Ríos ©
IUSC - 2009
35
Slide 36
Y Arguiñano nos dice:
José Ríos ©
IUSC - 2009
36
Slide 37
Y Arguiñano nos dice:
José Ríos ©
IUSC - 2009
37
Slide 38
Y Arguiñano nos dice:
José Ríos ©
IUSC - 2009
38
Slide 39
Intervalos de confianza
Si repetimos el intervalo de confianza a lo largo
del tiempo sobre la misma población, los
intervalos de confianza al 95% calculados para
cada muestra deberían incluir el verdadero valor
de la población en el 95% de las veces.
Una persona ‘normal’ es aquella que no ha sido
lo suficientemente investigada.
José Ríos ©
IUSC - 2009
39
Slide 40
Amplitud del IC
También depende de la información que la
muestra proporciona sobre el verdadero valor
poblacional
Mayor tamaño de muestra ->
mayor precisión -> IC más estrecho
Mayor dispersión de la medida ->
IC más amplio
José Ríos ©
IUSC - 2009
40
Slide 41
Por ejemplo…
OR entre casos y controles de consumo de tabaco y EP. Intervalos de confianza del 90%.
Fuente: Viñes, R. Larumbe, M.T. Artázcoz, I. Gaminde, D. Guerrero, J.V. Ferrer Estudio epidemiológico de la
enfermedad de Parkinson en Navarra. Revista ANALES del Sistema Sanitario de Navarra, Vol. 22,
Suplemento 3, 1999
José Ríos ©
IUSC - 2009
41
Slide 42
Estimación
Pero hemos de tener en cuenta que todo intervalo de
confianza conlleva dos noticias, la buena y la mala
José Ríos ©
La buena: hemos usado una técnica que en % alto de casos
acierta.
La mala: no sabemos si ha acertado en nuestro caso.
IUSC - 2009
42
Slide 43
Pruebas paramétricas y no-paramétricas
Una prueba paramétrica requiere la estimación de
uno o más parámetros (estadísticos) de la población
Ej.: Una estimación de la diferencia entre la media antes y
después de una intervención
Las pruebas no-paramétricas no involucran ningún
tipo de estimación de parámetros
Ej.: Facilitarnos la una estimación de la P[X>Y],
probabilidad de que, selecionando un paciente después
del tratamiento, su valor sea mayor que antes del
tratamiento
José Ríos ©
IUSC - 2009
43
Slide 44
Pruebas paramétricas y noparamétricas
Ventajas de las pruebas no-paramétricas
No se asume nada sobre la distribución de nuestros datos.
Se pueden usar en multitud de tipos de variables
Inconvenientes
A propósito de los datos
Las pruebas no-paramétricas acostumbran a tener un poder estadístico
menor que su equivalente paramétrico.
Utiliza rangos (ordenaciones), no da resultados en las unidades de las
variables originales.
El efecto de los valores extremos se diluye (buena noticia o mala)
Se deberían utilizar cuando los requerimientos para las pruebas
paramétricas no se cumplan.
José Ríos ©
IUSC - 2009
44
Slide 45
Estadísitica inferencial
Regresión
y Supervivencia
Slide 46
Regresión lineal
Describe como un variable respuesta ‘y’ cambia en
función de otra (típicamente ‘diseñada’) factor ‘x’ de
forma estrictamente lineal
Formalmente se asume que:
José Ríos ©
X no es una variable aleatoria (no tiene por qué cumplirse
siempre)
Para cada valor xi de X existe una v.a. Y|xi cuya media me
predice el modelo lineal
Todas las variables Y|xi son Normales, independientes y
de igual varianza
IUSC - 2009
46
Slide 47
Ejemplos macabros
Los llamaré macabros ya que son ilustrativos
de que el abuso debido a su simplicidad de
ejecución e interpretación puede tener
resultados nefastos
José Ríos ©
IUSC - 2009
47
Slide 48
Ejemplos macabros
José Ríos ©
IUSC - 2009
48
Slide 49
Ejemplos macabros
Y mucho cuidado con la ‘correlación’
La proporción de variabilidad explicada por la regresión es el r2 * 100
José Ríos ©
IUSC - 2009
49
Slide 50
Ejemplos macabros
Por que los abusos no son nada buenos
José Ríos ©
IUSC - 2009
50
Slide 51
J Allergy Clin Immunol 2006;117:989-94.)
José Ríos ©
IUSC - 2009
51
Slide 52
Ejemplo sencillo
¿El hábito tabáquico es un buen predictor
lineal para los niveles de tiocianato?
José Ríos ©
IUSC - 2009
52
Slide 53
Correlations
thiocy anato
serico
Pearson Correlation
Sig. (1-tailed)
1.000
-.540
f uma_cig
-.540
1.000
thiocy anato seric o
.
.000
.000
.
thiocy anato seric o
320
320
f uma_cig
320
320
f uma_cig
N
f uma_cig
thiocy anato seric o
Rec.: Y = a + b*X
José Ríos ©
IUSC - 2009
53
Slide 54
ANOVA b
Model
1
Sum of
Squares
df
Mean Square
Regression
294721.1
1
294721.071
Residual
717690.6
318
2256.889
Total
1012412
319
F
Sig.
.000a
130.587
a. Predictors: (Constant), fuma_cig
b. Dependent Variable: thiocyanato serico
C oefficients a
U nstandardized
C oefficients
Model
1
B
Standar dized
C oefficients
Std. Err or
(C onstant)
202.840
11.467
fuma_cig
-70.456
6.165
Beta
95% Confidence Interval for B
t
-.540
Sig.
Lower Bound
U pper Bound
17.688
.000
180.278
225.401
-11.427
.000
-82.586
-58.325
a. D ependent Variable: thiocyanato serico
Por tanto, la función que me indicaría la predicción lineal
sería: Y = 202.84 – 70.46*X
José Ríos ©
IUSC - 2009
54
Slide 55
¿A que parecía una buena opción?
José Ríos ©
IUSC - 2009
55
Slide 56
Otro más para acabar
¿La TAS es un buen predictor lineal para la
TAD?
Co rrelations
PAD media
Pearson C orrelation
PAD media
.628
.628
1.000
PASmed
Sig. (1-tailed)
N
José Ríos ©
PASmed
1.000
PAD media
.
.000
PASmed
.000
.
PAD media
1245
1245
PASmed
1245
1245
IUSC - 2009
56
Slide 57
Otro ejemplo
ANOVA b
Model
1
Sum of
Squares
Regression
df
Mean Square
7458229
1
7458228.588
Residual
11479900
1243
9235.640
Total
18938129
1244
F
Sig.
.000a
807.549
a. Predictors: (Constant), PASmed
b. Dependent Variable: PADmedia
C oefficients a
U nstandardized
C oefficients
Model
1
B
(C onstant)
PASmed
Standar dized
C oefficients
Std. Err or
386.210
18.509
.347
.012
Beta
95% Confidence Interval for B
t
.628
Sig.
Lower Bound
U pper Bound
20.866
.000
349.898
422.522
28.417
.000
.323
.370
a. D ependent Variable: PAD media
Por cada mmHg que aumenta la PAS, la PAD experimenta un
aumento, en promedio, de 0.347 mmHg
José Ríos ©
IUSC - 2009
57
Slide 58
¿Qué conclusión real se puede
obtener?
José Ríos ©
IUSC - 2009
58
Slide 59
Análisis de la supervivencia:
Motivos para su uso
En ocasiones importa tanto el tiempo hasta que se produce el
evento que su consecución.
Por ejemplo (por no ser más morboso): Evaluar el tiempo que se
tarda en la mejoría o curación
Estudiar n individuos
Ti será el tiempo que tarda el i-ésimo paciente en curarse
El problema viene cuando no se conoce Ti censura
Por tanto pueden existir variables que explican este tiempo.
Muy útil cuando el seguimiento es incompleto o muy variable
José Ríos ©
IUSC - 2009
59
Slide 60
Cuando usar estas técnicas
Deseamos un modelo para explicar tiempo hasta un
evento
‘Evento’ es dicotómico (regresión lineal no sirve)
Nos interesa el tiempo hasta evento (regresión logística no
sirve)
Deseamos comparar supervivencia entre grupos
Podremos evaluar la relación entre covariables y el
tiempo de supervivencia
José Ríos ©
IUSC - 2009
60
Slide 61
Cuando usar estas técnicas (II)
No es efectivo ni ético esperar a que se
presenten todos los eventos para finalizar el
estudio.
Los individuos entran en el estudio a tiempos
diferentes.
José Ríos ©
IUSC - 2009
61
Slide 62
¿Por qué no otras?
Técnica
Variables
Variable
predictoras respuesta
¿Existen
censuras?
Regresión
linear
Categóricas o Normalmente
continuas
distribuidas
No
Regresión
Logística
Categóricas o Binaria (menos
en regresión
continuas
No
logística
politomómica)
Tiempo y
Análisis de
supervivencia categóricas o
Binaria
Sí
continuas
José Ríos ©
IUSC - 2009
62
Slide 63
¿Qué estimamos?
Técnica
Modelo Matemático
Regresión
linear
Y=B1X + Bo
(linear)
Regresión
Logística
Ln(P/1-P)=B1X+Bo
(sigmoidal prob.)
h(t) = ho(t)exp(B1X+Bo)
Análisis de
supervivencia
José Ríos ©
IUSC - 2009
Evaluamos
Evaluación de
pendiente (cambio
lineal)
Odds ratios
Hazard rates
63
Slide 64
Posibles ejemplos de diseño (o no)
Evaluar la mortalidad en el post-operatorio
Reclutamos durante 5 años a 350 pacientes y los
seguimos durante un tiempo de seis meses
Se seleccionan a 100 pacientes y se aleatorizan a
dos brazos de tratamiento. La aparición del evento
se evalúa en consecutivas visitas programadas
durante tres años
Miramos la aparición espontánea de un evento en el
trascurso de un estudio de cohortes
José Ríos ©
IUSC - 2009
64
Slide 65
Yo os doy una de las soluciones
Mortalidad postoperatoria
Al no haber un seguimiento prolongado no tiene sentido
hablar de censuras y se dispone de toda la información de
los sujetos.
Surgical Priority
Emergency
Non-Emergency
Total
Discharge Status
Dead
Alive
24
9
289
100
313
109
Total
33
389
422
Chi-Square = 0.04
Degrees of Freedom = (2-1)(2-1) = 1
p = 0.084
José Ríos ©
IUSC - 2009
65
Slide 66
¿Y las censuras?
Existen de varios tipos, pero aquí hablaremos sólo de las
que se producen de forma aleatoria por la derecha
http://www.ms.uky.edu/~mai/java/stat/KapMei.html
José Ríos ©
IUSC - 2009
66
Slide 67
¿Por qué censuras?
Se produce por la imposibilidad práctica de
tener información precisa del momento del
evento en la totalidad de los sujetos.
El día de cierre no se ha presentado el evento
Hemos perdido el seguimiento del sujeto
Motivos
José Ríos ©
Acontecimiento adverso
Cierre del estudio/seguimiento
Pérdida de seguimiento
Evento por causa diferentes a la del estudio
IUSC - 2009
67
Slide 68
Pero existe una clasificación
Tipo I.
José Ríos ©
Todos los individuos se siguen
hasta una fecha fin de estudio
Por la derecha:
Pacientes vivos al finalizar el estudio
Pacientes perdidos o abandonos
En intervalo:
Las visitas de control son espaciadas
Por la izquierda:
Se desconoce la fecha de inicio
Tipo II.
Los individuos se siguen hasta
que han ocurrido r eventos
IUSC - 2009
68
Slide 69
¿Falta de seguimiento?
José Ríos ©
IUSC - 2009
69
Slide 70
¿Qué pasó con el último paciente?
José Ríos ©
IUSC - 2009
70
Slide 71
Por ejemplo…
José Ríos ©
IUSC - 2009
71
Slide 72
¿Y si el evento es repetido?
Los modelos generales de Cox se realizan
contra un evento único
El seguimiento del paciente se trunca en el primer
evento
Es suficiente para evaluar eventos ‘no repetibles’
como la mortalidad
¿Es este tipo de análisis suficiente en todos
los casos?
José Ríos ©
IUSC - 2009
72
Slide 73
En EC quizás no mucho
El modelo general de Cox lo que pretende es
ver como una característica inicial modifica la
presencia de un evento
En EC, el tratamiento aleatorizado.
Hay variables que se modifican a lo largo del
seguimiento que pueden propiciar el evento
Cox con covariables tiempo-dependiente
José Ríos ©
IUSC - 2009
73
Slide 74
Esquemáticamente
Modelo AG
Evento
Evento
Modelo PWP
Evento
Evento
Evento
Evento
Evento
O mezclas…
Evento
Evento
Evento
Evento
Nota: El grosor de la flecha indica el ‘riesgo’ potencial de presentar el evento
José Ríos ©
IUSC - 2009
74
Slide 75
Pero hay muchos métodos para
analizar este tipo de datos
José Ríos ©
IUSC - 2009
75
Slide 76
José Ríos ©
IUSC - 2009
76
Slide 77
“Los métodos estadísticos no son un sustituto
del sentido común y la objetividad. Nunca
deberían estar dirigidos a confundir al lector,
sino que deben ser una contribución
importante a la claridad de los argumentos
científicos”
SJ Pocock. Br J Psychiat 1980; 137:188-190
José Ríos ©
IUSC - 2009
77
Slide 78
José Ríos ©
IUSC - 2009
78
Análisis estadístico básico: t-test,
anova, pruebas no paramétricas,
regresión...
José Ríos
Slide 2
¿Es cierto el bostezo inducido?
José Ríos ©
IUSC - 2009
2
Slide 3
Hoy toca
estadística
José Ríos ©
IUSC - 2009
3
Slide 4
Por que claro… conociendo toda la información
somos capaces de saber como se llega a los
resultados
José Ríos ©
IUSC - 2009
4
Slide 5
Pero antes hablemos de variables…
Tiempo
Presencia
Ocurrencia
No lo consideran
Obligan a determinarlo
Enfermedad
-Prevalencia
-Incidencia
-Estado opinión
Exposición
(población)
Encuestas
-Recurrencia
Densidad de
incidencia
(individuo)
No interesa la evolución temporal
Estudio
José Ríos ©
transversal
longitudinal
IUSC - 2009
5
Slide 6
… y de la importancia metodológica
del tamaño de la muestra
José Ríos ©
IUSC - 2009
6
Slide 7
Resumen de datos
Tres tipos básicos
Posición: también llamadas medidas de tendencia central.
Dispersión: conocidas también como medidas de escala
Forma: sirven para el estudio de la asimetría y
apuntamiento comparado con la curva gaussiana
José Ríos ©
IUSC - 2009
7
Slide 8
Resumen de datos
Medidas de Posición
Media aritmética
xi
X
i 1
n
n
José Ríos ©
En el caso de datos agrupados en intervalos, la
media se calculará con el valor medio de intervalo
Únicamente tiene sentido para variables
cuantitativas
IUSC - 2009
8
Slide 9
Resumen de datos
Medidas de Posición
Mediana
1,3,3,4,6,13,14,14,18
6
1,3,3,4,6,13,14,14,17,18
6 y 13
Mediana=(6+13)/2=9.5
José Ríos ©
Deja a ambos ‘lados’ la misma población.
El valor de la mediana no tiene por que existir en la
muestra
Para su cálculo sólo se requiere que las clases sean
ordenables, podemos, por tanto, calcularla tanto
para variables cuantitativas como cualitativas
ordinales
IUSC - 2009
9
Slide 10
Resumen de datos
Medidas de Posición
Moda
José Ríos ©
Es el valor más frecuente en nuestros datos
En el caso de variables que tomen muchos
valores, el cálculo de la moda es preferible con
los datos agrupados, obtendremos el intervalo
modal
Su cálculo tiene sentido para cualquier tipo de
variable. Sólo usa el valor de las frecuencias
IUSC - 2009
10
Slide 11
Resumen de datos
Medidas de Posición
Cuantiles.
Son de orden (a). Dejan el a 100% de la
población por debajo.
Los percentiles dividen la población en
porcentajes, los terciles, cuartiles y quintiles
fracciones.
El segundo cuartil coincide con la Mediana
José Ríos ©
IUSC - 2009
11
Slide 12
Resumen de datos
Medidas de Posición
Propiedades.
La Media es sensible a los valores extremos, la Mediana
no lo es.
Media 1
Media 2
Nuevo valor en
la muestra
Mediana 1
Mediana 2
José Ríos ©
Especial atención en estudios de análisis de supervivencia
IUSC - 2009
12
Slide 13
¿Pero entonces?
Media
Moda
Mediana
José Ríos ©
IUSC - 2009
13
Slide 14
Resumen de datos
Medidas de Posición
Atención, siempre es mejor ‘visualizar’ los datos antes de
trabajar con ellos.
Es posible que ni la Media ni la Mediana representen bien el
comportamiento ‘central’ de la variable
En este caso, Media y Mediana tienen el mismo valor, ¿algún
comentario?
José Ríos ©
IUSC - 2009
14
Slide 15
Resumen de datos
Medidas Escala (dispersión)
Dos Grandes Familias
Recorridos
Varianzas
José Ríos ©
IUSC - 2009
15
Slide 16
Resumen de datos
Medidas Escala (dispersión)
José Ríos ©
Rangos y amplitudes: valores pequeños en
recorridos o rangos dan idea de poco dispersión,
valores grandes indican mucha dispersión o presencia
de valores extremos.
El Rango (Mín – Máx) se ve extremadamente
afectado por valores extremos, no es, por tanto, una
buena medida.
El recorrido intercualtílico (1er Cuartil – 3er Cuartil)
también indica dispersión.
Ambos valores combinados pueden dar buena idea
de cómo son los datos
IUSC - 2009
16
Slide 17
Resumen de datos
Medidas Escala (dispersión)
Veamos un ejemplo de cálculo
José Ríos ©
IUSC - 2009
17
Slide 18
Resumen de datos
Medidas Escala (dispersión)
¿Qué ocurre si sumamos todas las distancias?
Las distancias negativas son compensadas con las
positivas. La suma es siempre cero
Def.: la media es el centro de gravedad de la distribución
muestral
José Ríos ©
IUSC - 2009
18
Slide 19
Resumen de datos
Medidas Escala (dispersión)
2
José Ríos ©
La varianza es la media
de la suma de las
desviaciones respecto a
la media elevadas al
cuadrado.
La Desviación estandar
es la raíz del anterior
El Coeficiente de
variación usa las
medidas de posición y
escala
1
n
x
n 1
i
2
i 1
2
1
n 1
DE
x
n
i
i 1
1
n 1
2
x
n
i 1
i
2
x *100
CV
IUSC - 2009
19
2
Slide 20
Resumen de datos
Medidas Escala (dispersión)
Pregunta:
¿Por qué si tenemos la varianza acabamos utilizando la
DE? ¿Complicamos los estadísticos inútilmente los
cálculos?
El problema de la varianza es que no se mide en las
mismas unidades que los datos de la muestra, es por
eso que se define la DE
José Ríos ©
IUSC - 2009
20
Slide 21
Resumen de datos
Medidas Escala (dispersión)
Bien.... Pero ¿qué medida es la
buena?
Por si sola ninguna. Siempre es
preferible ver todas ellas, visualizar
los datos siempre ayuda mucho a
detectar posibles problemas en los
datos
Nos podemos ayudar de
Histogramas y Diagramas de cajas
(Box-Plot)
José Ríos ©
IUSC - 2009
21
Slide 22
Resumen de datos
Medidas Escala (dispersión)
El diagrama de caja (Box-Plot),
interpretación:
Nos presenta el Rango y el recorrido
intercuartílico (ojo con el programa utilizado)
Valores fuera de límites son representados con
círculos se consideran ‘normales’
Valores presentados como asterísticos se
podrían estudiar como atípicos
José Ríos ©
OJO CON DESCARTAR ‘ALEGREMENTE’ VALORES
ATÍPICOS
IUSC - 2009
22
Slide 23
Resumen de datos
Medidas Escala (dispersión)
El diagrama de caja (Box-Plot)
Máximo
190
142
141
180
50% de la
muestra
170
Aquí se
espera
encontrar la
mayoría de
la muestra
Mediana
160
150
1
140
Mínimo
130
N=
142
TALLA
José Ríos ©
IUSC - 2009
23
Slide 24
Resumen de datos
Medidas de forma
Medida de asimetría
n
Coef .asimetría
(n 1)(n 2)
( x i x) 3
s
Medida de apuntamiento o kurtosis
n(n + 1)
Kurtosis
(n 1)(n 2)(n 3)
José Ríos ©
( x i x) 4
3(n 1) 2
s
(n 2)(n 3)
IUSC - 2009
24
Slide 25
Resumen de datos
Medidas de forma
Medida de asimetría
Simétrica
Coef.=0
José Ríos ©
Asimétrica positiva
Coef. > 0
IUSC - 2009
Asimétrica negativa
Coef. < 0
25
Slide 26
Descripción gráfica
90
80
70
60
ESPECIE
19
Setosa
50
113
Versico l
Virginic
40
N=
50
50
1
2
50
3
especie
José Ríos ©
Se comparan el largo del sepalo de tres variedades de
lirios: setosa, versicola y virginica
IUSC - 2009
26
Slide 27
Descripción gráfica
Gráfico de dispersión (Scatter Plot)
80
70
60
E SP ECIE
50
Virginic a
Ver s ic o lor
40
Setos a
0
10
20
30
40
50
60
70
Largo pétalo
José Ríos ©
IUSC - 2009
27
Slide 28
Pudiendo resultar útil
setosa
versicolor
virginica
José Ríos ©
IUSC - 2009
28
Slide 29
Descripción gráfica
Una posible evaluación gráfica de los Odds Ratio (OR)
Evento
José Ríos ©
IUSC - 2009
BMI
No
Sí
Odds
OR
<20
6
9
1.50
2.65
(20-25]
23
27
1.17
2.07
(25-30]
30
17
0.57
>=30
9
7
0.78
1.37
29
Slide 30
Estadísitica inferencial
P-valor
Intervalo
de confianza
Paramétricas vs. No paramétricas
Slide 31
Génesis de las ideas
Karl Raimund Popper (1902-1994)
•1934: La lógica de la investigación científica. ¿Cómo
fundamentar el conocimiento científico, por definición
universal y necesario, en la experiencia empírica, por
definición particular?
•Hasta entonces
•Descartes confía en las leyes eternas de la razón
•Hume en las leyes que se extraen de la experiencia
•En contra del positivismo: ¿Cómo realizar una ley universal
a partir de un número particular de experimentos?
•A favor del falibilismo (o falsación): el conocimiento
científico no puede avanzar confirmando nuevas leyes, sino
descartando leyes que contradicen la experiencia.
POR TANTO:
La labor del científico consiste en criticar leyes para ir reduciendo el
número de teorías compatibles con observaciones experimentales.
CONSECUENCIA:
Una proposición científica lo será si es posible crear un experimento
que la pudiese contradecir.
José Ríos ©
IUSC - 2009
31
Slide 32
Pruebas de hipótesis
Unilateral (una cola)
Ho: E - C 0
H 1: E - C > 0
Bilateral (dos colas)
Ho: E - C = 0
H 1: E - C > 0 ó E - C < 0
José Ríos ©
IUSC - 2009
32
Slide 33
¿p?
Probabilidad de observar, por azar, una diferencia
como la de la muestra o mayor, cuando H0 es cierta
Es una medida de la evidencia en contra de la H0
Es el azar una explicación posible de las diferencias
observadas?
Supongamos que así es (H0).
¿Con qué probabilidad observaríamos unas
diferencias de esa magnitud, o incluso mayor? P-
valor
Si P-valor pequeño, rechazamos H0.
¿Difícil?... No, es como un juicio!
José Ríos ©
IUSC - 2009
33
Slide 34
¿p?
Se acepta un valor máximo de 5% (0,05).
Si p0,05 diferencias estadísticamente significativas.
Si p>0,05 diferencias estadísticamente NO
significativas.
NO
implica importancia clínica.
NO
implica magnitud de efecto!!
Influenciada por el tamaño de la muestra. Si n p
José Ríos ©
IUSC - 2009
34
Slide 35
Pero el mío es mejor.
Para un mismo resultado
cuantitativo el
‘investigador avispado’
puede hacer SU
interpretación cualitativa
simplemente inundando el
artículo de valores de p
Misma magnitud de efecto
Misma relevancia clínica
Mayor tamaño de muestra
Menor valor de p
(habitualmente)
¿?
Mayor relevancia clínica
José Ríos ©
IUSC - 2009
35
Slide 36
Y Arguiñano nos dice:
José Ríos ©
IUSC - 2009
36
Slide 37
Y Arguiñano nos dice:
José Ríos ©
IUSC - 2009
37
Slide 38
Y Arguiñano nos dice:
José Ríos ©
IUSC - 2009
38
Slide 39
Intervalos de confianza
Si repetimos el intervalo de confianza a lo largo
del tiempo sobre la misma población, los
intervalos de confianza al 95% calculados para
cada muestra deberían incluir el verdadero valor
de la población en el 95% de las veces.
Una persona ‘normal’ es aquella que no ha sido
lo suficientemente investigada.
José Ríos ©
IUSC - 2009
39
Slide 40
Amplitud del IC
También depende de la información que la
muestra proporciona sobre el verdadero valor
poblacional
Mayor tamaño de muestra ->
mayor precisión -> IC más estrecho
Mayor dispersión de la medida ->
IC más amplio
José Ríos ©
IUSC - 2009
40
Slide 41
Por ejemplo…
OR entre casos y controles de consumo de tabaco y EP. Intervalos de confianza del 90%.
Fuente: Viñes, R. Larumbe, M.T. Artázcoz, I. Gaminde, D. Guerrero, J.V. Ferrer Estudio epidemiológico de la
enfermedad de Parkinson en Navarra. Revista ANALES del Sistema Sanitario de Navarra, Vol. 22,
Suplemento 3, 1999
José Ríos ©
IUSC - 2009
41
Slide 42
Estimación
Pero hemos de tener en cuenta que todo intervalo de
confianza conlleva dos noticias, la buena y la mala
José Ríos ©
La buena: hemos usado una técnica que en % alto de casos
acierta.
La mala: no sabemos si ha acertado en nuestro caso.
IUSC - 2009
42
Slide 43
Pruebas paramétricas y no-paramétricas
Una prueba paramétrica requiere la estimación de
uno o más parámetros (estadísticos) de la población
Ej.: Una estimación de la diferencia entre la media antes y
después de una intervención
Las pruebas no-paramétricas no involucran ningún
tipo de estimación de parámetros
Ej.: Facilitarnos la una estimación de la P[X>Y],
probabilidad de que, selecionando un paciente después
del tratamiento, su valor sea mayor que antes del
tratamiento
José Ríos ©
IUSC - 2009
43
Slide 44
Pruebas paramétricas y noparamétricas
Ventajas de las pruebas no-paramétricas
No se asume nada sobre la distribución de nuestros datos.
Se pueden usar en multitud de tipos de variables
Inconvenientes
A propósito de los datos
Las pruebas no-paramétricas acostumbran a tener un poder estadístico
menor que su equivalente paramétrico.
Utiliza rangos (ordenaciones), no da resultados en las unidades de las
variables originales.
El efecto de los valores extremos se diluye (buena noticia o mala)
Se deberían utilizar cuando los requerimientos para las pruebas
paramétricas no se cumplan.
José Ríos ©
IUSC - 2009
44
Slide 45
Estadísitica inferencial
Regresión
y Supervivencia
Slide 46
Regresión lineal
Describe como un variable respuesta ‘y’ cambia en
función de otra (típicamente ‘diseñada’) factor ‘x’ de
forma estrictamente lineal
Formalmente se asume que:
José Ríos ©
X no es una variable aleatoria (no tiene por qué cumplirse
siempre)
Para cada valor xi de X existe una v.a. Y|xi cuya media me
predice el modelo lineal
Todas las variables Y|xi son Normales, independientes y
de igual varianza
IUSC - 2009
46
Slide 47
Ejemplos macabros
Los llamaré macabros ya que son ilustrativos
de que el abuso debido a su simplicidad de
ejecución e interpretación puede tener
resultados nefastos
José Ríos ©
IUSC - 2009
47
Slide 48
Ejemplos macabros
José Ríos ©
IUSC - 2009
48
Slide 49
Ejemplos macabros
Y mucho cuidado con la ‘correlación’
La proporción de variabilidad explicada por la regresión es el r2 * 100
José Ríos ©
IUSC - 2009
49
Slide 50
Ejemplos macabros
Por que los abusos no son nada buenos
José Ríos ©
IUSC - 2009
50
Slide 51
J Allergy Clin Immunol 2006;117:989-94.)
José Ríos ©
IUSC - 2009
51
Slide 52
Ejemplo sencillo
¿El hábito tabáquico es un buen predictor
lineal para los niveles de tiocianato?
José Ríos ©
IUSC - 2009
52
Slide 53
Correlations
thiocy anato
serico
Pearson Correlation
Sig. (1-tailed)
1.000
-.540
f uma_cig
-.540
1.000
thiocy anato seric o
.
.000
.000
.
thiocy anato seric o
320
320
f uma_cig
320
320
f uma_cig
N
f uma_cig
thiocy anato seric o
Rec.: Y = a + b*X
José Ríos ©
IUSC - 2009
53
Slide 54
ANOVA b
Model
1
Sum of
Squares
df
Mean Square
Regression
294721.1
1
294721.071
Residual
717690.6
318
2256.889
Total
1012412
319
F
Sig.
.000a
130.587
a. Predictors: (Constant), fuma_cig
b. Dependent Variable: thiocyanato serico
C oefficients a
U nstandardized
C oefficients
Model
1
B
Standar dized
C oefficients
Std. Err or
(C onstant)
202.840
11.467
fuma_cig
-70.456
6.165
Beta
95% Confidence Interval for B
t
-.540
Sig.
Lower Bound
U pper Bound
17.688
.000
180.278
225.401
-11.427
.000
-82.586
-58.325
a. D ependent Variable: thiocyanato serico
Por tanto, la función que me indicaría la predicción lineal
sería: Y = 202.84 – 70.46*X
José Ríos ©
IUSC - 2009
54
Slide 55
¿A que parecía una buena opción?
José Ríos ©
IUSC - 2009
55
Slide 56
Otro más para acabar
¿La TAS es un buen predictor lineal para la
TAD?
Co rrelations
PAD media
Pearson C orrelation
PAD media
.628
.628
1.000
PASmed
Sig. (1-tailed)
N
José Ríos ©
PASmed
1.000
PAD media
.
.000
PASmed
.000
.
PAD media
1245
1245
PASmed
1245
1245
IUSC - 2009
56
Slide 57
Otro ejemplo
ANOVA b
Model
1
Sum of
Squares
Regression
df
Mean Square
7458229
1
7458228.588
Residual
11479900
1243
9235.640
Total
18938129
1244
F
Sig.
.000a
807.549
a. Predictors: (Constant), PASmed
b. Dependent Variable: PADmedia
C oefficients a
U nstandardized
C oefficients
Model
1
B
(C onstant)
PASmed
Standar dized
C oefficients
Std. Err or
386.210
18.509
.347
.012
Beta
95% Confidence Interval for B
t
.628
Sig.
Lower Bound
U pper Bound
20.866
.000
349.898
422.522
28.417
.000
.323
.370
a. D ependent Variable: PAD media
Por cada mmHg que aumenta la PAS, la PAD experimenta un
aumento, en promedio, de 0.347 mmHg
José Ríos ©
IUSC - 2009
57
Slide 58
¿Qué conclusión real se puede
obtener?
José Ríos ©
IUSC - 2009
58
Slide 59
Análisis de la supervivencia:
Motivos para su uso
En ocasiones importa tanto el tiempo hasta que se produce el
evento que su consecución.
Por ejemplo (por no ser más morboso): Evaluar el tiempo que se
tarda en la mejoría o curación
Estudiar n individuos
Ti será el tiempo que tarda el i-ésimo paciente en curarse
El problema viene cuando no se conoce Ti censura
Por tanto pueden existir variables que explican este tiempo.
Muy útil cuando el seguimiento es incompleto o muy variable
José Ríos ©
IUSC - 2009
59
Slide 60
Cuando usar estas técnicas
Deseamos un modelo para explicar tiempo hasta un
evento
‘Evento’ es dicotómico (regresión lineal no sirve)
Nos interesa el tiempo hasta evento (regresión logística no
sirve)
Deseamos comparar supervivencia entre grupos
Podremos evaluar la relación entre covariables y el
tiempo de supervivencia
José Ríos ©
IUSC - 2009
60
Slide 61
Cuando usar estas técnicas (II)
No es efectivo ni ético esperar a que se
presenten todos los eventos para finalizar el
estudio.
Los individuos entran en el estudio a tiempos
diferentes.
José Ríos ©
IUSC - 2009
61
Slide 62
¿Por qué no otras?
Técnica
Variables
Variable
predictoras respuesta
¿Existen
censuras?
Regresión
linear
Categóricas o Normalmente
continuas
distribuidas
No
Regresión
Logística
Categóricas o Binaria (menos
en regresión
continuas
No
logística
politomómica)
Tiempo y
Análisis de
supervivencia categóricas o
Binaria
Sí
continuas
José Ríos ©
IUSC - 2009
62
Slide 63
¿Qué estimamos?
Técnica
Modelo Matemático
Regresión
linear
Y=B1X + Bo
(linear)
Regresión
Logística
Ln(P/1-P)=B1X+Bo
(sigmoidal prob.)
h(t) = ho(t)exp(B1X+Bo)
Análisis de
supervivencia
José Ríos ©
IUSC - 2009
Evaluamos
Evaluación de
pendiente (cambio
lineal)
Odds ratios
Hazard rates
63
Slide 64
Posibles ejemplos de diseño (o no)
Evaluar la mortalidad en el post-operatorio
Reclutamos durante 5 años a 350 pacientes y los
seguimos durante un tiempo de seis meses
Se seleccionan a 100 pacientes y se aleatorizan a
dos brazos de tratamiento. La aparición del evento
se evalúa en consecutivas visitas programadas
durante tres años
Miramos la aparición espontánea de un evento en el
trascurso de un estudio de cohortes
José Ríos ©
IUSC - 2009
64
Slide 65
Yo os doy una de las soluciones
Mortalidad postoperatoria
Al no haber un seguimiento prolongado no tiene sentido
hablar de censuras y se dispone de toda la información de
los sujetos.
Surgical Priority
Emergency
Non-Emergency
Total
Discharge Status
Dead
Alive
24
9
289
100
313
109
Total
33
389
422
Chi-Square = 0.04
Degrees of Freedom = (2-1)(2-1) = 1
p = 0.084
José Ríos ©
IUSC - 2009
65
Slide 66
¿Y las censuras?
Existen de varios tipos, pero aquí hablaremos sólo de las
que se producen de forma aleatoria por la derecha
http://www.ms.uky.edu/~mai/java/stat/KapMei.html
José Ríos ©
IUSC - 2009
66
Slide 67
¿Por qué censuras?
Se produce por la imposibilidad práctica de
tener información precisa del momento del
evento en la totalidad de los sujetos.
El día de cierre no se ha presentado el evento
Hemos perdido el seguimiento del sujeto
Motivos
José Ríos ©
Acontecimiento adverso
Cierre del estudio/seguimiento
Pérdida de seguimiento
Evento por causa diferentes a la del estudio
IUSC - 2009
67
Slide 68
Pero existe una clasificación
Tipo I.
José Ríos ©
Todos los individuos se siguen
hasta una fecha fin de estudio
Por la derecha:
Pacientes vivos al finalizar el estudio
Pacientes perdidos o abandonos
En intervalo:
Las visitas de control son espaciadas
Por la izquierda:
Se desconoce la fecha de inicio
Tipo II.
Los individuos se siguen hasta
que han ocurrido r eventos
IUSC - 2009
68
Slide 69
¿Falta de seguimiento?
José Ríos ©
IUSC - 2009
69
Slide 70
¿Qué pasó con el último paciente?
José Ríos ©
IUSC - 2009
70
Slide 71
Por ejemplo…
José Ríos ©
IUSC - 2009
71
Slide 72
¿Y si el evento es repetido?
Los modelos generales de Cox se realizan
contra un evento único
El seguimiento del paciente se trunca en el primer
evento
Es suficiente para evaluar eventos ‘no repetibles’
como la mortalidad
¿Es este tipo de análisis suficiente en todos
los casos?
José Ríos ©
IUSC - 2009
72
Slide 73
En EC quizás no mucho
El modelo general de Cox lo que pretende es
ver como una característica inicial modifica la
presencia de un evento
En EC, el tratamiento aleatorizado.
Hay variables que se modifican a lo largo del
seguimiento que pueden propiciar el evento
Cox con covariables tiempo-dependiente
José Ríos ©
IUSC - 2009
73
Slide 74
Esquemáticamente
Modelo AG
Evento
Evento
Modelo PWP
Evento
Evento
Evento
Evento
Evento
O mezclas…
Evento
Evento
Evento
Evento
Nota: El grosor de la flecha indica el ‘riesgo’ potencial de presentar el evento
José Ríos ©
IUSC - 2009
74
Slide 75
Pero hay muchos métodos para
analizar este tipo de datos
José Ríos ©
IUSC - 2009
75
Slide 76
José Ríos ©
IUSC - 2009
76
Slide 77
“Los métodos estadísticos no son un sustituto
del sentido común y la objetividad. Nunca
deberían estar dirigidos a confundir al lector,
sino que deben ser una contribución
importante a la claridad de los argumentos
científicos”
SJ Pocock. Br J Psychiat 1980; 137:188-190
José Ríos ©
IUSC - 2009
77
Slide 78
José Ríos ©
IUSC - 2009
78