Transcript intervalos

DISTRIBUCION
DE FRECUENCIAS
DESPUES DE LA RECOPILACION DE LOS DATOS,
ES NECESARIO,CLASIFICARLOS, RESUMIRLOS Y
PRESENTARLOS EN FORMA TAL, QUE FACILITEN
SU COMPRENSION Y SU POSTERIOR ANALISIS Y
UTILIZACION. PARA ELLO SE ORDENAN EN UNA
TABLA DE DISTRIBUCION DE FRECUENCIAS Y
LUEGO SE PRESENTARAN EN GRAFICOS.
TABLA DE DISTRIBUCION
DE FRECUENCIAS
*PRESENTAN LA DISTRIBUCION DE UN CONJUNTO
DE DATOS DE ACUERDO AL TIPO DE VARIABLE QUE
SE TENGA. EN ELLA SE OBSERVA LA FRECUENCIA
(NUMERO DE DATOS OBSERVADOS EN CADA CLASE
O INTERVALO)DESPUES DE REALIZAR EL PROCESO
DE CONTEO O TABULACION.
*UNO DE LOS USOS DE LAS TABLAS DE FRECUENCIAS
ES PARA CALCULAR ALGUNOS INDICADORES DE
RESUMEN, COMO LOS ESTADISTICOS.
EN EL PROCEDIMIENTO PARA CONSTRUIR TABLAS
DE FRECUENCIAS NOS REFERIREMOS SIEMPRE A
MUESTRAS.
TABLA DE FRECUENCIAS
PARA VARIABLES CUALITATIVAS
Ejemplo: DE UN ESTUDIO DE INVESTIGACION
REALIZADA EN FORMA ALEATORIA A 80 PERSONAS
DE 12 A 20 AÑOS SE REGISTRARON LOS PROGRAMAS
MAS VISTOS EN LA TV.LOS RESULTADOS FUERON:
variable
PROGRAMAS
Nº DE TELEVIDENTES
NOTICIEROS
17
SERIES
15
NOVELAS
18
DIBUJOS
16
CULTURALES
14
TOTAL
80
frecuencias
TABLA DE FRECUENCIAS PARA LA PREFERENCIA DE PROGRAMAS DE TV.
PROGRAMAS
Frecuencia Absoluta (fi)
(número de televidentes)
Frecuencia Relativa (hi)
NOTICIEROS
17
0.2125
SERIES
15
0.1875
NOVELAS
18
0.2250
DIBUJOS
16
0.2000
CULTURALES
14
0.1750
TOTAL
n=80
1.0000
(1)La frecuencia absoluta fi, es el número de datos observados en
cada categoria o modalidad. La suma de todas las frecuencias
absolutas es igual al total de datos observados (n=80).
(2)La frecuencia relativa hi se define por hi = fi /n
La suma de todas las frecuencias relativas es igual a uno.
(3)La frecuencia relativa se convierte en % multiplicandola por 100
(4)Las frecuencias relativas son conocidas como proporciones.
CON LA INFORMACION DE LA TABLA PODEMOS
REALIZAR ALGUNAS PREGUNTAS:
1.-¿CUANTAS PERSONAS PREFIEREN VER LOS
NOTICIEROS? RPTA. 17
2.-¿CUÁNTAS PERSONAS NO PREFIEREN VER EL
LOS NOTICIEROS? RPTA. 63
3.-¿QUÉ PORCENTAJE DE PERSONAS PREFIEREN VER
LAS SERIES? RPTA. 18.75%
4.-¿CUÁL ES EL PORCENTAJE DE PERSONAS QUE NO
PREFIEREN VER LAS SERIES? RPTA. 81.25%
GRAFICOS PARA VARIABLES CUALITATIVAS
LA INFORMACION OBTENIDA EN LA TABLA DE
FRECUENCIAS PUEDE SER MOSTRADA EN
GRAFICOS ADECUADOS.
DIAGRAMAS DE BARRAS
FRECUENCIA ABSOLUTA
20
15
10
5
0
NOTICIEROS
SERIES
NOVELAS
DIBUJOS
PROGRAMAS
CULTURALES
DIAGRAMA CIRCULAR O TIPO PASTEL
NOTICIEROS
21%
CULTURAL
18%
DIBUJOS
20%
NOVELAS
22%
SERIES
19%
LOS SECTORES CIRCULARES
QUE COMPRENDEN LA GRAFICA
CIRCULAR TIENEN ANGULO
CENTRAL DADO POR:
hi x 360º
TABLA DE FRECUENCIAS SIMPLES
PARA VARIABLES CUANTITATIVAS
DISCRETAS
•SE EMPLEAN PARA DATOS CUANTITATIVOS
DISCRETOS(VALORES ENTEROS).
• CUANDO SOLAMENTE SE PRESENTAN POCOS
DATOS DISTINTOS.
Ejemplo: SE HA REALIZADO UNA ENCUESTA A 20
FAMILIAS PARA SABER EL NUMERO DE HIJOS QUE
TIENEN , Y SE HA OBTENIDO EL SIGUIENTE
RESULTADO:
3
7
7
6
7
4
5
1
4
5
5
9
4
2
4
6
7
4
7
6
CONSTRUYA UNA TABLA DE DISTRIBUCION
DE FRECUENCIAS.
TABLA DE FRECUENCIAS PARA EL NUMERO DE HIJOS POR FAMILIA
NºDE
HIJOS
TARJAS O CONTEO
fi
(NUMERO DE FAMILIAS)
1
/
1
2
/
1
3
/
1
4
////
5
5
///
3
6
///
3
7
////
5
8
9
TOTAL
hi
0
/
1
n = 20
0.05
0.05
0.05
0.25
0.15
0.15
0.25
0.00
0.05
1.00
GRAFICO DE LINEAS O BASTONES PARA
VARIABLES CUANTITATIVAS DISCRETAS
Frecuencia absoluta
No de familias
6
5
4
3
2
1
0
1
2
3
4
5
6
No de hijos
7
8
9
Frecuencias relativas
% de familias
30
25
20
15
10
5
0
1
2
3
4
5
6
No de hijos
7
8
9
TABLA DE FRECUENCIAS POR
INTERVALOS
VARIABLES CUANTITATIVAS CONTINUAS
Y TAMBIEN DISCRETAS
LA DISTRIBUCION DE FRECUENCIAS POR CLASE
O INTERVALOS SE USA CUANDO LA VARIABLE
ESTADISTICA ES CUANTITATIVA CONTINUA O
CUANDO EL NUMERO DE VALORES DISTINTOS
DE UNA VARIABLE DISCRETA ES MUY GRANDE
(GENERALMENTE MAS DE 20).
ESTRUCTURA DE UNA TABLA DE FRECUENCIAS
POR INTERVALOS
“VARIABLE”
[Li , Ls > Xi
Total
fi
hi
Fi
Hi
k
n  f
i 1
i
Donde: [Li , Ls> : Intervalos o Clases Li : Limite Inferior
Ls : Limite Supeior
Xi : Marca de clase
fi : frecuencia absoluta
hi : frecuencia relativa
Fi : Frecuencia absoluta acumulada
Hi : Frecuencia relativa acumulada
CARACTERISTICAS
1.- LA FRECUENCIA ABSOLUTA (fi) INDICA LA
CANTIDAD DE OBSERVACIONES QUE HAY
EN EL i-ESIMO INTERVALO.
2.- LA FRECUENCIA RELATIVA (hi) INDICA LA
FRACCION DE LAS OBSERVACIONES QUE
ESTAN EN EL i-ESIMO INTERVALO: hi= fi /n
3.- F1= f1
F2= f1+ f2
Fk= f1+ f2+...+ fk
H1= h1
H2= h1+ h2
Hk= h1+ h2+...+ hk
4.- EN TODA TABLA DE DISTRIBUCION DE
FRECUENCIAS POR INTERVALOS:
k

i 1
k
fi  n
h
i 1
i
Fk  n
1
5.- LA MARCA DE CLASE ES LA SEMISUMA DE
LOS LIMITES DE CLASE
L L
X 
2
i
s
i
6.- EL ANCHO DE CLASE “C” REPRESENTA LA
LONGITUD DEL INTERVALO: C = Ls – Li
GENERALMENTE ES CONSTANTE.
7.- CUANDO EL ANCHO DE CLASE ES CONSTANTE
ENTONCES LA DISTANCIA ENTRE LAS MARCAS
DE CLASE ES CONSTANTE E IGUAL A “C”.
PROCEDIMIENTO PARA LA CONSTRUCION DE
TABLAS DE FRECUENCIAS POR INTERVALOS
1) CALCULAR EL RANGO:
R = Xmáx – Xmin
2) HALLAR EL NUMERO DE INTERVALOS “K”,MEDIANTE
LA FORMULA DE “STURGES”: K = 1+3.3 Log(n)
DONDE “n” ES EL NUMERO DE DATOS, Y “K” SE
REDONDEA A UN VALOR ENTERO (REDONDEO SIMPLE)
EJMS: si K=6.28 SE REDONDEA A 6
si K=6.5 SE REDONDEA A 7
3) DETERMINAR EL ANCHO DE CLASE:
C = R /K
DONDE C SE REDONDEA POR EXCESO, DE ACUERDO
AL NUMERO DE DECIMALES QUE TIENEN LOS DATOS.
El valor de C dependerá de la cantidad de lugares decimales de los datos
originales, que serán agrupados en la tabla de frecuencias:
Ejemplo de dato
original
Ejemplo de
valor de C
calculado
5.75
Se
redondea
a:
(dato con 1 decimal)
2.33782129
2.4
11.13
(dato con 2 decimales)
3.24920976
3.25
5.391
(dato con 3 decimales)
1.42135709
1.422
9.2876405
9.2877
15
3.2
(dato entero)
99.3489
(con 4 decimales)
6
EJEMPLO 1. SI LA VARIABLE CUANTITATIVA ES DISCRETA
Se ha aplicado una encuesta a 40 centros educativos con el fin de
observar el número de niños que estudian en ellos, obteniendose:
42
58
79
86
98
120
134
120
59
62
85
89
76
110
104
78
84
96
90
75
120
130
122
95
82
94
108
79
105
115
102
80
56
78
84
66
69
78
84
98
construya una tabla de frecuencias adecuada.
PROCEDIMIENTO:
Rango: R=
134 - 42 = 92
Número de intervalos: K = 1 + 3.3 log 40 = 6,29
(fórmula de Sturges)
redondeo simple a 6
Ancho de clase: C =92 / 6 = 15,33
redondeamos por exceso de decimales
a 16
Número de niños (variable)
Intervalos
Xi
fi
hi
Fi
Hi
[42-58>
50
2
0.050
2
0.050
[58-74>
66
5
0.125
7
0.175
[74-90>
82
15
0.375
22
0.550
[90-106>
98
9
0.225
31
0.775
[106-122>
114
6
0.150
37
0.925
[122-138>
130
3
0.075
40
1.000
n=40
1.000
TOTAL
Tarjas
o conteo
Centros educativos
EJEMPLO 2: SI LA VARIABLE CUANTITATIVA
ES CONTINUA.
En un comercio, se dispone de los datos de la venta semanal
(en miles de soles) para las últimas 30 semanas.
Construya una tabla de distribución de frecuencias.
14,6
12,8
13,9
15,3
14,2
15,6
14,2
13,4
13,8
14,5
15,2
14,4
12,9
12,4
13
15,5
15,6
15,8
15,7
15,8
13,9
14,2
14,9
13,1
12,2
14,1
15,1
15,7
13,4
13,2
PROCEDIMIENTO:
1. R= Xmax – X min = 15,8 – 12,2 = 3,6
2. Hallar K mediante Sturges:
K= 1 + 3,3 log (30) = 5,8745 aprox. 6 (redondeo simple)
3. Determinar el ancho de clase C:
C= 3,6 / 6 =0,6 (no se redondea, porque ya tiene un decimal
como los datos)
Venta miles de soles (variable)
Intervalos
Tarjas
o conteo
[12,2-12,8>
Número de semanas
Xi
fi
hi
Fi
Hi
//
12,5
2
0,0667
2
0,0667
[12,8-13,4>
/////
13,1
5
0,1667
7
0,2334
[13,4-14,0>
/////
13,7
5
0,1667
12
0,4000
[14,0-14,6>
//////
14,3
6
0,2000
18
0,6000
[14,6-15,2>
///
14,9
3
0,1000
21
0,7000
[15,2-15,8>
////// ///
15,5
9
0,3000
30
1,0000
n=30
1.0000
TOTAL
INTERPRETACIONES UTILIZANDO LA TABLA
DE FRECUENCIAS
1.- ¿Cuántas semanas tienen ventas entre 14,0 y 14,6 miles de soles?
Rpta. f4 = 6 semanas.
2.- ¿Cuál es la proporción o el porcentaje del número de semanas
cuyas ventas se encuentran entre 12,8 y 13,4 miles de soles?
Rpta. h2 = 0,1667 ó h2 = 16,67%
3.- ¿Cuántas semanas tienen ventas menores a 14,6 miles de soles?
Rpta. F4 = 18 semanas
4.- ¿Cuál es la proporción o el porcentaje del número de semanas
cuyas ventas son menores a 15,2 miles de soles?
Rpta. H5 = 0,70 ó H5 = 70%
LAS GRAFICAS EN UNA TABLA
DE FRECUENCIAS
Histograma de Frecuencias Absolutas
9
Frequencia Absoluta
8
7
6
5
4
3
2
1
0
12.2
12.8
13.4
14.0
Ventas
14.6
15.2
15.8
Histograma de Frecuencias Relativas (%)
30
Frequencia Relativa %
25
20
15
10
5
0
12.2
12.8
13.4
14.0
Ventas
14.6
15.2
15.8
Poligono de Frecuencias Absolutas
9
numero de semanas
8
7
6
5
4
3
2
1
0
12.5
13.1
13.7
14.3
Ventas
14.9
15.5
Polígono de frecuencias absolutas
Num. de semanas
10
8
6
4
2
0
12.5
13.1
13.7
14.3
ventas
14.9
15.5
Observación
•Los polígonos de frecuencia son especialmente
útiles para comparar las distribuciones de dos
grupos de datos diferentes, para ello es
conveniente trabajar en un mismo gráfico y
empleando los mismos intervalos.
•Importante: Si la cantidad de datos es muy
diferente en ambos grupos es preferible trabajar
con polígonos de frecuencia relativa.
OJIVA
UNA OJIVA ES LA REPRESENTACION GRAFICA DE
UNA DISTRIBUCION DE FRECUENCIAS ABSOLUTAS
ACUMULADAS O LAS FRECUENCIAS RELATIVAS
ACUMULADAS.
OJIVA “MENOR QUE” O ASCENDENTE
ES LA REPRESENTACION GRAFICA DE UNA
DISTRIBUCION DE FRECUENCIAS ABSOLUTAS
ACUMULADAS “MENOR QUE” O LAS FRECUENCIAS
RELATIVAS ACUMULADAS “MENOR QUE”.
DEL EJEMPLO1:
Fi
*
40
MENOR
QUE
Fi
42
58
74
90
106
122
138
0
2
7
22
31
37
40
OJIVA MENOR QUE
Hi
*
37
0
0.05
0.174
0.550
0.775
0.925
1.000
31
*
*
22
7
*
2
*
*
0
42
58
74
90
106
122
138
DIAGRAMAS DE TALLOS Y HOJAS
ES UNA TECNICA QUE SE USA PARA ORGANIZAR
LOS DATOS COMO PRIMER PASO EN UN ANALISIS
EXPLORATORIO DE DATOS.
OBJETIVOS:
REPRESENTACION VISUAL DE LA INFORMACION.
DESCRIBIR UN PATRON DE COMPORTAMIENTO
DE LOS DATOS, ES DECIR QUE DISTRIBUCION
PUEDEN SEGUIR LOS DATOS.
IDENTIFICAR SI HAY VALORES EXTREMOS O
DATOS ANORMALES O VALORES ATIPICOS.
PROCEDIMIENTO:
ORDENAR LOS DATOS DE LA VARIABLE EN
FORMA CRECIENTE.
TOMAR COMO TALLO LA PRIMERA O LAS DOS
PRIMERAS CIFRAS DEL DATO Y COMO HOJA
LA ULTIMA CIFRA. A CONTINUACION SEPARADOS
POR UNA LINEA VERTICAL SE COLOCAN LOS
TALLOS A LA IZQUIERDA Y LAS HOJAS A LA
DERECHA DEL TALLO CORRESPONDIENTE.
DE ESTA FORMA CADA TALLO SE REPRESENTA
UNA SOLA VEZ Y DEFINE UNA CLASE Y EL
NUMERO DE HOJAS REPRESENTA LA FRECUENCIA
DE LA CADA CLASE.
EJEMPLOS:
. PARA DATOS CON DOS CIFRAS, ESCRIBIR A LA
IZQUIERDA DE LA LINEA LA CIFRA DE LAS
DECENAS, QUE FORMAN EL TALLO, Y A LA
DERECHA LAS UNIDADES QUE SERAN LAS HOJAS.
POR EJEMPLO ESCRIBIR 85:
TALLO
8
HOJA
5
ESCRIBIR 329 COMO TALLO Y HOJA
TALLO
32
HOJA
9
Para los siguientes datos, construya un diagrama tallos y hojas:
12, 15,18, 22,24, 26, 27, 31, 33, 33,35, 36, 42, 42, 45, 46, 50, 51, 53
LEAF UNIT = 1.0
TALLO
HOJAS
3
1
258
7
2
2467
(5)
3
13356
7
4
2256
3
5
013
ES LA UNIDAD DE HOJA,DICE DONDE
PONER EL PUNTO DECIMAL, EN EL
EJEMPLO LEAF UNIT=1.0 ASI LA
PRIMERA OBSERVACION ES 12 ,SI LEAF
UNIT FUERA 0.10 SERIA 1.2, SI LEAF UNIT
FUERA 10 ENTONCES EL VALOR SERIA
120.
CENTRO DE LA DISTRIBUCION
¡OBSERVE QUE SE PARECE A UN
HISTOGRAMA VOLTEADO!