Transcript intervalos
DISTRIBUCION DE FRECUENCIAS DESPUES DE LA RECOPILACION DE LOS DATOS, ES NECESARIO,CLASIFICARLOS, RESUMIRLOS Y PRESENTARLOS EN FORMA TAL, QUE FACILITEN SU COMPRENSION Y SU POSTERIOR ANALISIS Y UTILIZACION. PARA ELLO SE ORDENAN EN UNA TABLA DE DISTRIBUCION DE FRECUENCIAS Y LUEGO SE PRESENTARAN EN GRAFICOS. TABLA DE DISTRIBUCION DE FRECUENCIAS *PRESENTAN LA DISTRIBUCION DE UN CONJUNTO DE DATOS DE ACUERDO AL TIPO DE VARIABLE QUE SE TENGA. EN ELLA SE OBSERVA LA FRECUENCIA (NUMERO DE DATOS OBSERVADOS EN CADA CLASE O INTERVALO)DESPUES DE REALIZAR EL PROCESO DE CONTEO O TABULACION. *UNO DE LOS USOS DE LAS TABLAS DE FRECUENCIAS ES PARA CALCULAR ALGUNOS INDICADORES DE RESUMEN, COMO LOS ESTADISTICOS. EN EL PROCEDIMIENTO PARA CONSTRUIR TABLAS DE FRECUENCIAS NOS REFERIREMOS SIEMPRE A MUESTRAS. TABLA DE FRECUENCIAS PARA VARIABLES CUALITATIVAS Ejemplo: DE UN ESTUDIO DE INVESTIGACION REALIZADA EN FORMA ALEATORIA A 80 PERSONAS DE 12 A 20 AÑOS SE REGISTRARON LOS PROGRAMAS MAS VISTOS EN LA TV.LOS RESULTADOS FUERON: variable PROGRAMAS Nº DE TELEVIDENTES NOTICIEROS 17 SERIES 15 NOVELAS 18 DIBUJOS 16 CULTURALES 14 TOTAL 80 frecuencias TABLA DE FRECUENCIAS PARA LA PREFERENCIA DE PROGRAMAS DE TV. PROGRAMAS Frecuencia Absoluta (fi) (número de televidentes) Frecuencia Relativa (hi) NOTICIEROS 17 0.2125 SERIES 15 0.1875 NOVELAS 18 0.2250 DIBUJOS 16 0.2000 CULTURALES 14 0.1750 TOTAL n=80 1.0000 (1)La frecuencia absoluta fi, es el número de datos observados en cada categoria o modalidad. La suma de todas las frecuencias absolutas es igual al total de datos observados (n=80). (2)La frecuencia relativa hi se define por hi = fi /n La suma de todas las frecuencias relativas es igual a uno. (3)La frecuencia relativa se convierte en % multiplicandola por 100 (4)Las frecuencias relativas son conocidas como proporciones. CON LA INFORMACION DE LA TABLA PODEMOS REALIZAR ALGUNAS PREGUNTAS: 1.-¿CUANTAS PERSONAS PREFIEREN VER LOS NOTICIEROS? RPTA. 17 2.-¿CUÁNTAS PERSONAS NO PREFIEREN VER EL LOS NOTICIEROS? RPTA. 63 3.-¿QUÉ PORCENTAJE DE PERSONAS PREFIEREN VER LAS SERIES? RPTA. 18.75% 4.-¿CUÁL ES EL PORCENTAJE DE PERSONAS QUE NO PREFIEREN VER LAS SERIES? RPTA. 81.25% GRAFICOS PARA VARIABLES CUALITATIVAS LA INFORMACION OBTENIDA EN LA TABLA DE FRECUENCIAS PUEDE SER MOSTRADA EN GRAFICOS ADECUADOS. DIAGRAMAS DE BARRAS FRECUENCIA ABSOLUTA 20 15 10 5 0 NOTICIEROS SERIES NOVELAS DIBUJOS PROGRAMAS CULTURALES DIAGRAMA CIRCULAR O TIPO PASTEL NOTICIEROS 21% CULTURAL 18% DIBUJOS 20% NOVELAS 22% SERIES 19% LOS SECTORES CIRCULARES QUE COMPRENDEN LA GRAFICA CIRCULAR TIENEN ANGULO CENTRAL DADO POR: hi x 360º TABLA DE FRECUENCIAS SIMPLES PARA VARIABLES CUANTITATIVAS DISCRETAS •SE EMPLEAN PARA DATOS CUANTITATIVOS DISCRETOS(VALORES ENTEROS). • CUANDO SOLAMENTE SE PRESENTAN POCOS DATOS DISTINTOS. Ejemplo: SE HA REALIZADO UNA ENCUESTA A 20 FAMILIAS PARA SABER EL NUMERO DE HIJOS QUE TIENEN , Y SE HA OBTENIDO EL SIGUIENTE RESULTADO: 3 7 7 6 7 4 5 1 4 5 5 9 4 2 4 6 7 4 7 6 CONSTRUYA UNA TABLA DE DISTRIBUCION DE FRECUENCIAS. TABLA DE FRECUENCIAS PARA EL NUMERO DE HIJOS POR FAMILIA NºDE HIJOS TARJAS O CONTEO fi (NUMERO DE FAMILIAS) 1 / 1 2 / 1 3 / 1 4 //// 5 5 /// 3 6 /// 3 7 //// 5 8 9 TOTAL hi 0 / 1 n = 20 0.05 0.05 0.05 0.25 0.15 0.15 0.25 0.00 0.05 1.00 GRAFICO DE LINEAS O BASTONES PARA VARIABLES CUANTITATIVAS DISCRETAS Frecuencia absoluta No de familias 6 5 4 3 2 1 0 1 2 3 4 5 6 No de hijos 7 8 9 Frecuencias relativas % de familias 30 25 20 15 10 5 0 1 2 3 4 5 6 No de hijos 7 8 9 TABLA DE FRECUENCIAS POR INTERVALOS VARIABLES CUANTITATIVAS CONTINUAS Y TAMBIEN DISCRETAS LA DISTRIBUCION DE FRECUENCIAS POR CLASE O INTERVALOS SE USA CUANDO LA VARIABLE ESTADISTICA ES CUANTITATIVA CONTINUA O CUANDO EL NUMERO DE VALORES DISTINTOS DE UNA VARIABLE DISCRETA ES MUY GRANDE (GENERALMENTE MAS DE 20). ESTRUCTURA DE UNA TABLA DE FRECUENCIAS POR INTERVALOS “VARIABLE” [Li , Ls > Xi Total fi hi Fi Hi k n f i 1 i Donde: [Li , Ls> : Intervalos o Clases Li : Limite Inferior Ls : Limite Supeior Xi : Marca de clase fi : frecuencia absoluta hi : frecuencia relativa Fi : Frecuencia absoluta acumulada Hi : Frecuencia relativa acumulada CARACTERISTICAS 1.- LA FRECUENCIA ABSOLUTA (fi) INDICA LA CANTIDAD DE OBSERVACIONES QUE HAY EN EL i-ESIMO INTERVALO. 2.- LA FRECUENCIA RELATIVA (hi) INDICA LA FRACCION DE LAS OBSERVACIONES QUE ESTAN EN EL i-ESIMO INTERVALO: hi= fi /n 3.- F1= f1 F2= f1+ f2 Fk= f1+ f2+...+ fk H1= h1 H2= h1+ h2 Hk= h1+ h2+...+ hk 4.- EN TODA TABLA DE DISTRIBUCION DE FRECUENCIAS POR INTERVALOS: k i 1 k fi n h i 1 i Fk n 1 5.- LA MARCA DE CLASE ES LA SEMISUMA DE LOS LIMITES DE CLASE L L X 2 i s i 6.- EL ANCHO DE CLASE “C” REPRESENTA LA LONGITUD DEL INTERVALO: C = Ls – Li GENERALMENTE ES CONSTANTE. 7.- CUANDO EL ANCHO DE CLASE ES CONSTANTE ENTONCES LA DISTANCIA ENTRE LAS MARCAS DE CLASE ES CONSTANTE E IGUAL A “C”. PROCEDIMIENTO PARA LA CONSTRUCION DE TABLAS DE FRECUENCIAS POR INTERVALOS 1) CALCULAR EL RANGO: R = Xmáx – Xmin 2) HALLAR EL NUMERO DE INTERVALOS “K”,MEDIANTE LA FORMULA DE “STURGES”: K = 1+3.3 Log(n) DONDE “n” ES EL NUMERO DE DATOS, Y “K” SE REDONDEA A UN VALOR ENTERO (REDONDEO SIMPLE) EJMS: si K=6.28 SE REDONDEA A 6 si K=6.5 SE REDONDEA A 7 3) DETERMINAR EL ANCHO DE CLASE: C = R /K DONDE C SE REDONDEA POR EXCESO, DE ACUERDO AL NUMERO DE DECIMALES QUE TIENEN LOS DATOS. El valor de C dependerá de la cantidad de lugares decimales de los datos originales, que serán agrupados en la tabla de frecuencias: Ejemplo de dato original Ejemplo de valor de C calculado 5.75 Se redondea a: (dato con 1 decimal) 2.33782129 2.4 11.13 (dato con 2 decimales) 3.24920976 3.25 5.391 (dato con 3 decimales) 1.42135709 1.422 9.2876405 9.2877 15 3.2 (dato entero) 99.3489 (con 4 decimales) 6 EJEMPLO 1. SI LA VARIABLE CUANTITATIVA ES DISCRETA Se ha aplicado una encuesta a 40 centros educativos con el fin de observar el número de niños que estudian en ellos, obteniendose: 42 58 79 86 98 120 134 120 59 62 85 89 76 110 104 78 84 96 90 75 120 130 122 95 82 94 108 79 105 115 102 80 56 78 84 66 69 78 84 98 construya una tabla de frecuencias adecuada. PROCEDIMIENTO: Rango: R= 134 - 42 = 92 Número de intervalos: K = 1 + 3.3 log 40 = 6,29 (fórmula de Sturges) redondeo simple a 6 Ancho de clase: C =92 / 6 = 15,33 redondeamos por exceso de decimales a 16 Número de niños (variable) Intervalos Xi fi hi Fi Hi [42-58> 50 2 0.050 2 0.050 [58-74> 66 5 0.125 7 0.175 [74-90> 82 15 0.375 22 0.550 [90-106> 98 9 0.225 31 0.775 [106-122> 114 6 0.150 37 0.925 [122-138> 130 3 0.075 40 1.000 n=40 1.000 TOTAL Tarjas o conteo Centros educativos EJEMPLO 2: SI LA VARIABLE CUANTITATIVA ES CONTINUA. En un comercio, se dispone de los datos de la venta semanal (en miles de soles) para las últimas 30 semanas. Construya una tabla de distribución de frecuencias. 14,6 12,8 13,9 15,3 14,2 15,6 14,2 13,4 13,8 14,5 15,2 14,4 12,9 12,4 13 15,5 15,6 15,8 15,7 15,8 13,9 14,2 14,9 13,1 12,2 14,1 15,1 15,7 13,4 13,2 PROCEDIMIENTO: 1. R= Xmax – X min = 15,8 – 12,2 = 3,6 2. Hallar K mediante Sturges: K= 1 + 3,3 log (30) = 5,8745 aprox. 6 (redondeo simple) 3. Determinar el ancho de clase C: C= 3,6 / 6 =0,6 (no se redondea, porque ya tiene un decimal como los datos) Venta miles de soles (variable) Intervalos Tarjas o conteo [12,2-12,8> Número de semanas Xi fi hi Fi Hi // 12,5 2 0,0667 2 0,0667 [12,8-13,4> ///// 13,1 5 0,1667 7 0,2334 [13,4-14,0> ///// 13,7 5 0,1667 12 0,4000 [14,0-14,6> ////// 14,3 6 0,2000 18 0,6000 [14,6-15,2> /// 14,9 3 0,1000 21 0,7000 [15,2-15,8> ////// /// 15,5 9 0,3000 30 1,0000 n=30 1.0000 TOTAL INTERPRETACIONES UTILIZANDO LA TABLA DE FRECUENCIAS 1.- ¿Cuántas semanas tienen ventas entre 14,0 y 14,6 miles de soles? Rpta. f4 = 6 semanas. 2.- ¿Cuál es la proporción o el porcentaje del número de semanas cuyas ventas se encuentran entre 12,8 y 13,4 miles de soles? Rpta. h2 = 0,1667 ó h2 = 16,67% 3.- ¿Cuántas semanas tienen ventas menores a 14,6 miles de soles? Rpta. F4 = 18 semanas 4.- ¿Cuál es la proporción o el porcentaje del número de semanas cuyas ventas son menores a 15,2 miles de soles? Rpta. H5 = 0,70 ó H5 = 70% LAS GRAFICAS EN UNA TABLA DE FRECUENCIAS Histograma de Frecuencias Absolutas 9 Frequencia Absoluta 8 7 6 5 4 3 2 1 0 12.2 12.8 13.4 14.0 Ventas 14.6 15.2 15.8 Histograma de Frecuencias Relativas (%) 30 Frequencia Relativa % 25 20 15 10 5 0 12.2 12.8 13.4 14.0 Ventas 14.6 15.2 15.8 Poligono de Frecuencias Absolutas 9 numero de semanas 8 7 6 5 4 3 2 1 0 12.5 13.1 13.7 14.3 Ventas 14.9 15.5 Polígono de frecuencias absolutas Num. de semanas 10 8 6 4 2 0 12.5 13.1 13.7 14.3 ventas 14.9 15.5 Observación •Los polígonos de frecuencia son especialmente útiles para comparar las distribuciones de dos grupos de datos diferentes, para ello es conveniente trabajar en un mismo gráfico y empleando los mismos intervalos. •Importante: Si la cantidad de datos es muy diferente en ambos grupos es preferible trabajar con polígonos de frecuencia relativa. OJIVA UNA OJIVA ES LA REPRESENTACION GRAFICA DE UNA DISTRIBUCION DE FRECUENCIAS ABSOLUTAS ACUMULADAS O LAS FRECUENCIAS RELATIVAS ACUMULADAS. OJIVA “MENOR QUE” O ASCENDENTE ES LA REPRESENTACION GRAFICA DE UNA DISTRIBUCION DE FRECUENCIAS ABSOLUTAS ACUMULADAS “MENOR QUE” O LAS FRECUENCIAS RELATIVAS ACUMULADAS “MENOR QUE”. DEL EJEMPLO1: Fi * 40 MENOR QUE Fi 42 58 74 90 106 122 138 0 2 7 22 31 37 40 OJIVA MENOR QUE Hi * 37 0 0.05 0.174 0.550 0.775 0.925 1.000 31 * * 22 7 * 2 * * 0 42 58 74 90 106 122 138 DIAGRAMAS DE TALLOS Y HOJAS ES UNA TECNICA QUE SE USA PARA ORGANIZAR LOS DATOS COMO PRIMER PASO EN UN ANALISIS EXPLORATORIO DE DATOS. OBJETIVOS: REPRESENTACION VISUAL DE LA INFORMACION. DESCRIBIR UN PATRON DE COMPORTAMIENTO DE LOS DATOS, ES DECIR QUE DISTRIBUCION PUEDEN SEGUIR LOS DATOS. IDENTIFICAR SI HAY VALORES EXTREMOS O DATOS ANORMALES O VALORES ATIPICOS. PROCEDIMIENTO: ORDENAR LOS DATOS DE LA VARIABLE EN FORMA CRECIENTE. TOMAR COMO TALLO LA PRIMERA O LAS DOS PRIMERAS CIFRAS DEL DATO Y COMO HOJA LA ULTIMA CIFRA. A CONTINUACION SEPARADOS POR UNA LINEA VERTICAL SE COLOCAN LOS TALLOS A LA IZQUIERDA Y LAS HOJAS A LA DERECHA DEL TALLO CORRESPONDIENTE. DE ESTA FORMA CADA TALLO SE REPRESENTA UNA SOLA VEZ Y DEFINE UNA CLASE Y EL NUMERO DE HOJAS REPRESENTA LA FRECUENCIA DE LA CADA CLASE. EJEMPLOS: . PARA DATOS CON DOS CIFRAS, ESCRIBIR A LA IZQUIERDA DE LA LINEA LA CIFRA DE LAS DECENAS, QUE FORMAN EL TALLO, Y A LA DERECHA LAS UNIDADES QUE SERAN LAS HOJAS. POR EJEMPLO ESCRIBIR 85: TALLO 8 HOJA 5 ESCRIBIR 329 COMO TALLO Y HOJA TALLO 32 HOJA 9 Para los siguientes datos, construya un diagrama tallos y hojas: 12, 15,18, 22,24, 26, 27, 31, 33, 33,35, 36, 42, 42, 45, 46, 50, 51, 53 LEAF UNIT = 1.0 TALLO HOJAS 3 1 258 7 2 2467 (5) 3 13356 7 4 2256 3 5 013 ES LA UNIDAD DE HOJA,DICE DONDE PONER EL PUNTO DECIMAL, EN EL EJEMPLO LEAF UNIT=1.0 ASI LA PRIMERA OBSERVACION ES 12 ,SI LEAF UNIT FUERA 0.10 SERIA 1.2, SI LEAF UNIT FUERA 10 ENTONCES EL VALOR SERIA 120. CENTRO DE LA DISTRIBUCION ¡OBSERVE QUE SE PARECE A UN HISTOGRAMA VOLTEADO!