Transcript medidasresu
medidas de resumen Procedimiento Problema variable en estudio Tipo de variable y escala de medida Ordenar los datos, amplitud y número de clases En un programa para la detección de hipertensión en una muestra de 30 hombres en edades entre 30 y 40 años, la distribución de la presión diastólica (mínima) en mm Hg fue la siguiente: 70 85 85 75 65 90 110 95 90 70 60 75 80 120 85 95 90 70 100 65 80 90 95 90 95 110 100 85 80 75 La variable en estudio es Tabla de frecuencias gráfico : presión diastólica ( medida en mm de Hg) Procedimiento Problema variable en estudio Tipo de variable y escala de medida Ordenar los datos, amplitud y número de clases Dentro de los tipos de variables y escalas de medida tenemos: tipos de variables escalas de medida categórica o de atributo nominal raza, sexo ordinal calificaciones intervalo temperatura razón peso, altura ejemplos numéricas v continuas v discretas Tabla de frecuencias gráfico La variable en estudio ( presión diastóloca ,mm de Hg) es numérica, continua . Escala de razón Procedimiento Los datos ordenados en forma creciente: Problema variable en estudio Tipo de variable y escala de medida Ordenar los datos, amplitud y número de clases Tabla de frecuencias gráfico 60 65 65 70 70 70 75 75 75 80 80 80 85 85 85 85 90 90 90 90 90 95 95 95 95 100 100 110 110 120 La amplitud total = 120 – 60 = 60 K K = 1 + 3.32log n = 5.90 = 6 clases Número de clases: Extensión del intervalo : h H = A/ K = 60/6 = 10 En este caso , entonces, la tabla de frecuencias tendrá aproximadamente 6 clases de amplitud 10 unidades en cada clase Otra forma de calcular k es n , en este caso 30 =5.48. Aproximando al entero superior, da 6 clases Procedimiento Problema variable en estudio Tipo de variable y escala de medida Ordenar los datos, amplitud y número de clases Tabla de frecuencias gráfico x f fr 60 -70 70 -80 80 -90 90 -100 100 -110 110 -120 120 -130 3 6 7 9 2 2 1 0.1 0.2 0.23 0.3 0.07 0.07 0.03 total 30 1.0 F Fr 3 9 16 25 27 29 30 0.1 0.3 0.53 0.83 0.90 0.97 1.00 Procedimiento Problema variable en estudio Tipo de variable y escala de medida Ordenar los datos, amplitud y número de clases De acuerdo con el tipo de variable (numérica ,continua) y su escala de medida (de razón), el gráfico más adecuado sería un histograma o un Polígono de frecuencias. En este ejemplo se utiliza un Histograma de la distribución de presión diastólica en mm de Hg según las frecuencias absolutas f 10 8 6 4 Tabla de frecuencias 2 gráfico 0 60 70 80 90 100 110 120 130 mmHg RESUMEN DE DATOS Se puede hacer a través de Una forma rápida de tener información sobre una distribución tablas gráficos Dan una idea global de la forma Otra forma es a través de las MEDIDAS DE RESUMEN MEDIA MEDIANA MODA medidas de tendencia central ó MEDIDAS DE RESUMEN medidas de tendencia central medidas de dispersión AMPLITUD TOTAL VARIANZA y A 2 2 DESVIACIÓN TIPICA SEMIRRECORRIDO INTERCUARTILICO COEFICIENTE DE VARIACION CV Q MEDIDAS DE RESUMEN medidas de tendencia central medidas de dispersión medidas de posición SEPARATRICES ó CUANTILES : deciles cuartiles D Q percentiles P 0.40 0.80 0.20 P20 P40 P80 MEDIDAS DE RESUMEN medidas de tendencia central medidas de dispersión medidas de posición medidas de asimetría (sesgo) asimetría positiva asimetría negativa distribución simétrica MEDIDAS DE RESUMEN medidas de tendencia central medidas de dispersión medidas de posición medidas de asimetría medidas de apuntamiento o curtosis Distrib. leptocurtica Distrib. platicurtica en azul la distribución normal (de referencia) distribución mesocurtica medidas de tendencia central y dispersión forman DUOS Media Varianza y desviación típica Mediana Semirrecorrido intercuartílico Moda Amplitud total Según teoría de momentos Datos numéricos – distribuciones simétricas o asimétricas con muchas observaciones Según el método de las separatrices Datos ordinales o numéricos distribución asimétrica y con pocas observacionesSegún el método de los extremos Datos nominales Distribuciones bimodales Moda y Amplitud total Datos nominales Distribuciones bimodales Moda (Mo) Rol estadistico (lista ordenada) Tabla de frec. Sin agrupar Tabla de frec. agrupados Valor más repetido (de mayor frecuentcia) x|f =máx 1 Li h 1 2 Amplitud total o recorrido (A) Ls – Li (límites reales) Ls – Li (límites reales de las clases superior e inferior) h Diferencia entre la frecuencia de la clase modal y la clase anterior Extensión del intervalo 1 2 Li Mo Limite inferior de la clase modal Diferencia entre la frecuencia de la clase modal y la clase siguiente x Mediana y semirrecorrido intercuartilico Datos ordinales o numéricos ; o se usa en Distribución asimétrica y con pocas observaciones Mediana (Mn) Rol estadistico (lista ordenada) Tabla de frec. Sin agrupar Tabla de frec. agrupados Semirrecorrido intercuartilico (Q) Valor central (si n es impar) Promedio de valores centrales ( si n es par) n / 2 Fa Li h f P75 – P25 2 ó Q3 – Q1 2 Fr 1 0.75 0.5 0.25 recorrido intercuartil 0 P25 Q1 P50 Q2 mediana P75 Q3 x Niveles de Hb en 61 adultos normales 105 110 125 126 138 138 148 148 153 153 158 159 160 168 168 112 127 138 148 154 160 170 112 128 138 149 149.5 154 160 172 118 130 141 150 154 163 172 119 132 142 150 154 164 176 120 133 133.5 144 150 155 164 179 120 134 145 151 156 165 Un resumen de esta serie en 5 valores Min =105 ; Max =179; Q1 = 133.5 ; Q3 = 159 ; Q2 =Mn= 149.5 recorrido intrercuartil Min Max Q1 105 133.5 Mn Q3 149,5 159 179 120 135 146 151 156 166 Media - Varianza y Desviación típica Datos numéricos ;distribuciones simétricas o asimétricas Media Varianza con muchas observaciones ó x n Tabla de frec. Sin agrupar fx n 2 Desviación típica = var Rol estadistico (lista ordenada) Tabla de frec. agrupados 2 fx n x x 2 n x x 2 n 1 f x x 2 n f x x 2 n 1 f x x n f x x 2 n 1 2 Al agrupar los datos se produce una perdida de información Mismo ejemplo anterior : Niveles de Hb (g/l) en 60 adultos normales DATOS AGRUPADOS Media 144,33 Mediana 147,22 Moda 153,64 Es la que más varia al agrupar Desviación estándar 18,67 DATOS SIN AGRUPAR Niveles de Hb (g/l) Media 145,715 Mediana 149,5 Moda 138 Desviación estándar 18,13 Curtosis -0,6643 Coeficiente de asimetría -0,3531 Amplitud total 74 Mínimo 105 Máximo 179 n 60 f Histograma 15 16 14 11 12 10 8 7 8 5 6 4 8 4 2 2 0100 Hb 110 120 130 140 150 160 170 180 En este caso el limite superior está incluido en la clase anterior ejemplo: Hb, en statgraphics