Transcript medidasresu

medidas de
resumen
Procedimiento
Problema
variable en estudio
Tipo de variable y
escala de medida
Ordenar los datos,
amplitud y número de
clases
En un programa para la detección de hipertensión en
una muestra de 30 hombres en edades entre 30 y 40
años, la distribución de la presión diastólica (mínima)
en mm Hg fue la siguiente:
70
85
85
75
65
90
110
95
90
70
60
75
80
120
85
95
90
70
100
65
80
90
95
90
95
110
100
85
80
75
La variable en estudio es
Tabla de frecuencias
gráfico
:
presión diastólica ( medida en mm de Hg)
Procedimiento
Problema
variable en estudio
Tipo de variable y
escala de medida
Ordenar los datos,
amplitud y número de
clases
Dentro de los tipos de variables y escalas de
medida tenemos:
tipos de
variables
escalas de
medida
categórica o
de atributo
nominal
raza, sexo
ordinal
calificaciones
intervalo
temperatura
razón
peso, altura
ejemplos
numéricas
v continuas
v discretas
Tabla de frecuencias
gráfico
La variable en estudio ( presión diastóloca ,mm de
Hg) es numérica, continua . Escala de razón
Procedimiento
Los datos ordenados en forma creciente:
Problema
variable en estudio
Tipo de variable y
escala de medida
Ordenar los datos,
amplitud y número de
clases
Tabla de frecuencias
gráfico
60
65
65
70
70
70
75
75
75
80
80
80
85
85
85
85
90
90
90
90
90
95
95
95
95
100
100
110
110
120
La amplitud total = 120 – 60 = 60
K
K = 1 + 3.32log n = 5.90 = 6 clases
Número de clases:
Extensión del intervalo : h
H = A/ K = 60/6 = 10
En este caso , entonces, la tabla de frecuencias tendrá
aproximadamente 6 clases de amplitud 10 unidades en cada
clase
Otra forma de calcular k es n , en este caso 30 =5.48.
Aproximando al entero superior, da 6 clases
Procedimiento
Problema
variable en estudio
Tipo de variable y
escala de medida
Ordenar los datos,
amplitud y número de
clases
Tabla de frecuencias
gráfico
x
f
fr
60 -70
70 -80
80 -90
90 -100
100 -110
110 -120
120 -130
3
6
7
9
2
2
1
0.1
0.2
0.23
0.3
0.07
0.07
0.03
total
30
1.0
F
Fr
3
9
16
25
27
29
30
0.1
0.3
0.53
0.83
0.90
0.97
1.00
Procedimiento
Problema
variable en estudio
Tipo de variable y
escala de medida
Ordenar los datos,
amplitud y número de
clases
De acuerdo con el tipo de variable (numérica ,continua) y su
escala de medida (de razón), el gráfico más adecuado sería
un histograma o un Polígono de frecuencias. En este
ejemplo se utiliza un
Histograma de la distribución de presión diastólica en
mm de Hg según las frecuencias absolutas
f 10
8
6
4
Tabla de frecuencias
2
gráfico
0
60
70
80
90
100 110 120 130 mmHg
RESUMEN DE DATOS
Se puede hacer a través de
Una forma rápida de tener
información sobre una distribución
 tablas
 gráficos
Dan una idea global de la
forma
Otra forma es a través de las
MEDIDAS DE RESUMEN
MEDIA
MEDIANA
MODA
medidas de tendencia central
 ó
MEDIDAS DE RESUMEN
 medidas de tendencia central
 medidas de dispersión
AMPLITUD TOTAL
VARIANZA
y
A
2
2
DESVIACIÓN TIPICA
SEMIRRECORRIDO INTERCUARTILICO
COEFICIENTE DE VARIACION
CV
Q
MEDIDAS DE RESUMEN
 medidas de tendencia central
 medidas de dispersión
 medidas de posición SEPARATRICES ó
CUANTILES : deciles
cuartiles
D
Q
percentiles P
0.40
0.80
0.20
P20
P40
P80
MEDIDAS DE RESUMEN




medidas de tendencia central
medidas de dispersión
medidas de posición
medidas de asimetría (sesgo)
asimetría positiva
asimetría negativa
distribución simétrica
MEDIDAS DE RESUMEN




medidas de tendencia central
medidas de dispersión
medidas de posición
medidas de asimetría  medidas de apuntamiento
o curtosis
Distrib. leptocurtica
Distrib. platicurtica
en azul la distribución normal (de referencia)
distribución mesocurtica
medidas de tendencia central y dispersión
forman DUOS
Media Varianza y
desviación típica
Mediana Semirrecorrido
intercuartílico
Moda Amplitud total
Según teoría de momentos
Datos numéricos –
distribuciones simétricas o asimétricas
con muchas observaciones
Según el método de las separatrices
Datos ordinales o numéricos
distribución asimétrica y con pocas
observacionesSegún el método de los extremos
Datos nominales
Distribuciones bimodales
Moda y Amplitud total
Datos nominales
Distribuciones bimodales
Moda
(Mo)
Rol estadistico
(lista ordenada)
Tabla de frec.
Sin agrupar
Tabla de frec.
agrupados
Valor más repetido
(de mayor frecuentcia)
x|f =máx
1
Li 
h
1   2
Amplitud total
o recorrido (A)
Ls – Li
(límites reales)
Ls – Li
(límites reales de las
clases superior e inferior)
h
Diferencia entre
la frecuencia de la
clase modal y la
clase anterior
Extensión del intervalo
1
2
Li
Mo
Limite inferior de la clase modal
Diferencia entre
la frecuencia de la
clase modal y la
clase siguiente
x
Mediana y semirrecorrido intercuartilico
Datos ordinales o numéricos ; o se usa en
Distribución asimétrica y con pocas observaciones
Mediana
(Mn)
Rol estadistico
(lista
ordenada)
Tabla de frec.
Sin agrupar
Tabla de frec.
agrupados
Semirrecorrido
intercuartilico (Q)
Valor central
(si n es impar)
Promedio de valores
centrales
( si n es par)
n / 2  Fa
Li 
h
f
P75 – P25
2
ó
Q3 – Q1
2
Fr
1
0.75
0.5
0.25
recorrido
intercuartil
0
P25
Q1
P50
Q2
mediana
P75
Q3
x
Niveles de Hb en 61 adultos normales
105
110
125
126
138
138
148
148
153
153
158 159 160
168
168
112
127
138
148
154
160
170
112
128
138
149 149.5
154
160
172
118
130
141
150
154
163
172
119
132
142
150
154
164
176
120
133 133.5
144
150
155
164
179
120
134
145
151
156
165
Un resumen de esta serie en 5 valores
Min =105 ; Max =179; Q1 = 133.5 ; Q3 = 159 ; Q2 =Mn= 149.5
recorrido intrercuartil
Min
Max
Q1
105
133.5
Mn
Q3
149,5 159
179
120
135
146
151
156
166
Media - Varianza y Desviación típica
Datos numéricos ;distribuciones simétricas
o asimétricas
Media
Varianza
con muchas
observaciones
 ó
x

n
Tabla de frec.
Sin agrupar
fx

n

2
Desviación típica =  var
Rol estadistico
(lista ordenada)
Tabla de frec.
agrupados
2
fx
n

x  x 2
n

x  x 2
n 1
f x  x 2

n
f x  x 2

n 1
f x  x 

n
f x  x 2

n 1
2
Al agrupar los datos se produce una perdida de información
Mismo ejemplo anterior : Niveles de Hb (g/l) en 60 adultos normales
DATOS AGRUPADOS
Media
144,33
Mediana
147,22
Moda
153,64 Es la que más
varia al agrupar
Desviación
estándar
18,67
DATOS SIN AGRUPAR
Niveles de Hb (g/l)
Media
145,715
Mediana
149,5
Moda
138
Desviación
estándar
18,13
Curtosis
-0,6643
Coeficiente
de asimetría -0,3531
Amplitud total 74
Mínimo 105
Máximo 179
n
60
f
Histograma
15
16
14
11
12
10
8
7
8
5
6
4
8
4
2
2
0100
Hb
110
120
130
140
150
160
170
180
En este caso el limite superior está incluido en
la clase anterior
ejemplo: Hb, en statgraphics