(1) Marco conceptual y distribucion de frecuencias

Download Report

Transcript (1) Marco conceptual y distribucion de frecuencias

UNIVERSIDAD NACIONAL FEDERICO VILLARREAL
ESCUELA UNIVERSITARIA DE POST-GRADO
ESTADISTICA BASICA
Exp. Renán Quispe LLanos
MARCO
CONCEPTUAL
Mg. Renán Quispe LLanos
MARCO CONCEPTUAL
¿Qué entiende por estadísticas y Estadística?
A un dato numérico o valor aislado se le denomina dato
estadístico. A un conjunto de datos numéricos se le
denomina estadísticas. El estudio general de las
estadísticas se define como la ciencia estadística o
Estadística.
Mg. Renán Quispe LLanos
DIVISIONES DE LA ESTADISTICA
ESTADISTICA DESCRIPTIVA
PROBABILIDAD
INFERENCIA ESTADISTICA
MODELOS DE REGRESION
Modelo Causal
Mg. Renán Quispe LLanos
MÉTODO ESTADÍSTICO
•
•
•
•
Recopilación.
Clasificación
Procesamiento
Tablas de
frecuencia
• Inferencia
• Presentación
• Interpretación
Mg. Renán Quispe LLanos
TABLAS DE FRECUENCIA
• En función del
Objetivo.
• Primera forma de
resumen .
• Organización de datos
• Clasificación
• Facilita la lectura
• Permite la graficación
• Previo a la
presentación.
40
35
30
25
20
15
10
5
0
2000
Hospitalización.
Mg. Renán Quispe LLanos
2001
Consultas
Mg. Renán Quispe LLanos
Mg. Renán Quispe LLanos
Mg. Renán Quispe LLanos
Mg. Renán Quispe LLanos
Mg. Renán Quispe LLanos
Mg. Renán Quispe LLanos
Mg. Renán Quispe LLanos
Mg. Renán Quispe LLanos
Mg. Renán Quispe LLanos
Mg. Renán Quispe LLanos
Mg. Renán Quispe LLanos
Mg. Renán Quispe LLanos
Mg. Renán Quispe LLanos
Mg. Renán Quispe LLanos
Mg. Renán Quispe LLanos
Mg. Renán Quispe LLanos
Mg. Renán Quispe LLanos
DISTRIBUCION DE
FRECUENCIAS
PERU: POBLACION OCUPADA URBANA
POR TAMAÑO DE EMPRESAS (%)
TAMAÑO DE LA EMPRESA
1997
1999
TOTAL
100,0
100,0
MENOS DE 5 PERSONAS
61,1
66,7
DE 5 A 10 PERSONAS
10,4
5,9
MAS DE 10 PERSONAS
28,5
27,5
FUENTE: Convenio INEI - MTPS - Encuesta Nacional de Hogares, 1997-99- III Trim.
Mg. Renán Quispe LLanos
DISTRIBUCION DE FRECUENCIAS
Elaboración de una distribución de frecuencias
Es un método estadístico muy útil para organizar un
conjunto de observaciones en forma significativa.
Además indica el número de veces que ocurre cada
valor o dato en cada clase.
Los pasos para elaborar una distribución de frecuencia
son los siguientes:
.Determinación del rango.
.Selección de los intervalos de clase.
.Determinar los límites de las clases.
.Efectuar la tabulación.
Mg. Renán Quispe LLanos
DISTRIBUCION DE FRECUENCIAS DE VARIABLES
CONTINUAS - EJEMPLO
Mg. Renán Quispe LLanos
Elaboración de una Tabla de Frecuencias para Variables
Continuas
1.-
Valor máximo: 1094
Valor mínimo : 320
2.-
Valor máximo - valor mínimo =1094
- 320 =774
3.-
Determinar el número de intervalos
de clase:
Mg. Renán Quispe LLanos
4.-Obtención de la amplitud de cada intervalo
R
A=__
NI
donde: R = Rango o recorrido
NI =Número de intervalos
Ejemplo:
Del ejemplo aplicativo
774
A = ___ = 96
8
En este caso, por comodidad de trabajo, se ha
redondeado la amplitud a 100.
Mg. Renán Quispe LLanos
5. Nuevo rango o recorrido.
R1=NI x A
R1=8 x 100 = 800
6. Obtención de la diferencia
d = R´- R
d = 800 - 774 = 26
7. Prorrateo gráfico de la diferencia
se coloca una
300 320
1024 1100 unidad en cada
extremo
Generalmente se reparte equitativamente en los
extremos las unidades de diferencia.
Mg. Renán Quispe LLanos
Luego:
Establecer
un
conjunto
de
agrupaciones, llamado también clases.
1.
Ingresos
mensuales
300-400
400-500
500-600
600-700
700-800
800-900
900-1000
1000-1100
Mg. Renán Quispe LLanos
2. Llevar la cuenta de los valores en las
clases. La práctica común es utilizar una
marca de cuenta (/) para señalar un valor.
Ingreso Mensual
300 -400
400 -500
500 -600
600 -700
700 -800
800 -900
900 -1000
1000-1100
Mg. Renán Quispe LLanos
Tarjas
///
////
////
////
////
////
////
////
//
////
////
////
////
////
/
//// //// //
//// //// //// //// //// ////
//// //// ////
3. Contar el número de marcas en cada clase. Para el
ejemplo de los ingresos mensuales:
Ingresos
Mensuales
300-400
400-500
500-600
600-700
700-800
800-900
900-1000
1000-1100
Total
Mg. Renán Quispe LLanos
Frecuencia
3
7
11
21
41
24
9
4
120
HISTOGRAMA
El histograma describe una distribución de frecuencias
utilizando una gráfica de barras en la que la altura de
cada barra es proporcional a la frecuencia de la clase
que representa. Histograma sobre los ingresos
mensuales
50
40
30
20
10
0
300
Mg. Renán Quispe LLanos
400
500
600
700
800
900
1000
1100
POLIGONO DE FRECUENCIAS
El polígono de frecuencia consiste en una línea
poligonal que unen los puntos determinados
por la intersección de del punto medio de
clase.
Ingresos
mensuales
300-400
400-500
500-600
600-700
700-800
800-900
900-1000
1000-1100
Mg. Renán Quispe LLanos
Marca de
Frecuencias
Clase
350
3
450
7
550
11
650
21
750
41
850
24
950
9
1050
4
Polígono de Frecuencia (Ingresos Mensuales)
P ol i gono de f r e c ue nc i a ( i ngr e sos me nsua l e s)
Polígono de frecuencias
45
40
35
30
25
20
15
10
5
0
250 350 450 550 650 750 850 950 1050 1150
Mg. Renán Quispe LLanos
POLIGONO DE FRECUENCIAS ACUMULADAS
Se utiliza cuando se desea determinar cuántas
observaciones se encuentran por encima o por
de abajo de ciertos valores.
Ingresos
mensuales
300-400
400-500
500-600
600-700
700-800
800-900
900-1000
1000-1100
Mg. Renán Quispe LLanos
Marca de
Clase
350
450
550
650
750
850
950
1050
Frecuencias
3
10
21
42
83
107
116
120
POLIGONO DE FRECUENCIAS ACUMULADAS “menos de”
140
120
100
80
60
40
20
0
300
1100
Mg. Renán Quispe LLanos
400
500
600
700
800
900
1000
REPRESENTACIONES DE TALLOS Y HOJAS
El diagrama de hojas y tallos de TUKEY es
un procedimiento semi – gráfico (tabular y
gráfico)
Objetivo:
El objetivo de una representación
tallo y hoja es organizar datos no
agrupados en forma significativa.
Mg. Renán Quispe LLanos
EJEMPLO
Los siguientes datos representan la longitud en mm.
de 16 camarones de un criadero:
114; 125; 114; 124;
143; 152; 133; 113;
178; 127; 135; 161;
126; 134; 147; 132.
Mg. Renán Quispe LLanos
EJEMPLO
Los datos se adecuan al caso b, por lo tanto el
diagrama será el siguiente:
Tallos
11
12
13
14
15
16
17
Mg. Renán Quispe LLanos
Hojas
443
5476
3542
37
2
1
8
Frecuencia
3
4
4
2
1
1
1
MEDIDAS DE
TENDENCIA
CENTRAL
¿QUE ES UN PROMEDIO?
Es el valor que representa a
un conjunto de datos y
señala un centro de sus
valores.
Mg. Renán Quispe LLanos
MEDIA DE UNA POBLACION
La media de una población se calcula con la siguiente
fórmula:
N

 Xi
i 1
N
Donde:

N
: indica
la media poblacional.
: número total de observaciones en la población.
N
 Xi
i 1
: suma de los elementos de la población.
Mg. Renán Quispe LLanos
MEDIANA
Es el valor de la posición central de los valores
después de ordenarlos de menor a mayor o de mayor a
menor.
Ejemplo: Sean los valores siguientes, los precios de
venta de departamentos:
S/. 60 000
65 000
70 000
80 000
275 000
Mg. Renán Quispe LLanos
MEDIANA
Realizando la ordenación de los valores, obtenemos:
Precios ordenados de
menor a mayor
S/. 60 000
65 000
70 000
80 000
270 000
Mg. Renán Quispe LLanos

Precios ordenados de
mayor a menor
Mediana

S/. 270 000
80 000
70 000
65 000
60 000
MODA
La moda es el valor de la observación que
aparece con más frecuencia.
Ejemplo:
De los datos presentados a continuación,
encontrar la moda:
2, 3, 4, 5, 2, 4, 4, 6, 7.
La moda es el número 4, ya que es el valor que
aparece con mayor frecuencia.
Mg. Renán Quispe LLanos
MEDIDAS DE
DISPERSION
ASIMETRIA Y
CURTOSIS
MEDIDAS DE DISPERSION
Para caracterizar completamente
una distribución, es necesario
conocer cómo están distribuidos
los valores de la variable
alrededor de un promedio.
Mg. Renán Quispe LLanos
¿Por qué estudiar la dispersión?
•Permite apreciar cuán dispersas
están dos o más distribuciones.
Ejemplo: Observemos los siguientes
tres conjuntos de datos:
1 2 3 4 5,
50
Mg. Renán Quispe LLanos
5 10 15 20 25,
10 20 30 40
LA VARIANZA
Indica la variación de las
observaciones en torno a
su media.
Mg. Renán Quispe LLanos
LA VARIANZA
Cálculo para datos agrupados:
Para una muestra:
S2 
xi
:
marca
2f


x

x
 i i
n 1
de
clase
donde i varía de 1 a m.
X
: media muestral.
fi
: frecuencia intervalo i.
n
: tamaño muestra.
Mg. Renán Quispe LLanos
del
intervalo
i,
LA DESVIACION ESTANDAR
La Desviación Estándar es la raíz cuadrada
positiva de la varianza.
Mg. Renán Quispe LLanos
MEDIDAS RELATIVAS DE DISPERSION
“COEFICIENTE DE VARIACION”
Es un número abstracto que, denotado por CV, se
obtiene
como
cociente
entre
la
desviación
es
muy
estándar y su media aritmética.
Características:
El
coeficiente
de
variación
útil
especialmente cuando se aplica a muestras
homogéneas.
Mg. Renán Quispe LLanos
COEFICIENTE DE VARIACION
Cálculo para Datos no agrupados y agrupados
CV 
s
100 para una población

S
CV  100 para una muestra
x
donde:
σ :
desviación estándar poblacional.
: desviación
estándar
muestral.
S : Sdesviación
estándar
muestral
1.
μ : media aritmética poblacional.
x : media aritmética muestral.
X : media aritmética muestral
Mg. Renán Quispe LLanos