unidad iii - WordPress.com

Download Report

Transcript unidad iii - WordPress.com

UNIDAD III
DESCRIPTORES NUMÉRICOS
Hasta ahora, para describir un conjunto
de datos, se han empleado tablas y
gráficos. Estos son útiles para dar
rápidamente una visión general del
comportamiento de los valores que
asume una variable; así, en el caso de
variables categóricas, los diagramas son
suficientes para dar una descripción
completa de las mismas.
Sin embargo, para describir el
comportamiento
de
variables
cuantitativas se requiere de una mayor
precisión que la que puede proporcionar
un gráfico.
• Medidas de tendencia central
• Medidas de posición y
• Medidas de dispersión
Cuando describimos conjuntos de datos
numéricos nos refiere a dos aspectos,
cada uno de los cuales se puede traducir
en una pregunta:
• ¿Existe algún valor de la variable que
represente a la mayoría de los valores del
conjunto de datos?
• ¿Qué tan separados están entre sí los
diferentes valores que asume la variable
respecto al valor de la variable que
representa a los datos?
Media aritmética para serie simple
Definición: Si x1,...., xn son los valores observados de
una variable X , la media aritmética o simplemente
media o promedio de estos datos se define como el
cociente de la suma de todos los valores observados
entre el número de datos o tamaño de la muestra. Su
expresión matemática es:
• Ejemplo 1: Los siguientes datos corresponden
a las notas de 5 estudiantes en el curso de
Estadística: 12, 15, 11, 09, 13. Encontraremos
el valor de la media aritmética.
• Solución:
• La nota promedio del curso es
• Ejemplo 2: Como parte de una tarea de
laboratorio de nutrición, 15 estudiantes de
tercer año de la Escuela Académico
profesional de Nutrición de la UES
matriculados el año académico 2004,
encontraron el número de calorías (X ) de una
porción de lasagña y obtuvieron los siguientes
valores:
29 35 47 18 22 30 51 62 15 42 46 53 16 27 33
• Solución:
Media aritmética ponderada
Nos permite calcular un promedio tomando en
cuenta la importancia o peso de cada valor
observado de la variable con respecto al total.
Su expresión matemática es:
donde i w , es la importancia o peso que se
asigna a cada valor de la variable.
Ejemplo 2: Supongamos que un profesor
decide utilizar un promedio ponderado para
obtener los promedios finales de cada uno
de los estudiantes que asisten al curso de
Estadística. El promedio de trabajos tendrá
un valor de 20% de la calificación del
estudiante; el examen parcial, 25%; el
examen final, 35%; y el promedio de
prácticas, 20%.
• Un estudiante obtuvo las siguientes notas:
17,10,14 y17 respectivamente.
• A partir de los datos calcularemos el promedio
final del estudiante
Por lo tanto el promedio ponderado es 14.9
puntos
Media aritmética para datos agrupados
Cuando la cantidad de datos es igual o mayor
a 30 es necesario agruparlos en tablas de
distribuciones de frecuencias y para calcular la
media aritmética se utiliza la siguiente
expresión:
Donde xi es el punto medio o la marca de clase
y fi la frecuencia absoluta
Ejemplo: Los alumnos del Doctorado en
Educación en el marco del curso de Estadística
Aplicada a la Investigación, realizaron una
investigación con el objetivo de establecer el
perfil de los estudiantes de maestría de la UES
matriculados en el semestre académico I-2000
y que ingresaron a la universidad entre los
años 1997 y 1999. Como el número total de
estudiantes que cursaban las diversas
maestrías era alrededor de 2,500, los alumnos
del doctorado en Educación decidieron
seleccionar una muestra de 30 estudiantes de
la maestría en Gestión Educativa.
A continuación se presentan los datos para la
variable número de hijos de los 30 maestristas.
Encontraremos el número promedio de hijos.
X(Numero de hijos)
0
1
2
3
4
5
Total
Fa( frecuencia absoluta)
2
11
11
0
3
3
30
Ejemplo: Los datos de los pesos de 50 personas se
presenta en la tabla de frecuencias a continuación
calcular el peso promedio
PESOS
Frec. Abs.
Xi
80<89
2
84.5
90<99
3
94.5
100<109
9
104.5
110<119
13
114.5
120<129
13
124.5
130<139
7
134.5
140<149
3
144.5
TOTAL
50
Ejemplo: En la siguiente tabla se presentan 42
muestras de azúcar en sangre realizada en 42
pacientes, calcular el promedio del nivel de
azúcar.
NIVEL DE AZUCAR
Frec. Abs.
4.00<4.87
2
4.88<5.75
7
5.76<6.63
12
6.64<7.51
5
7.52<8.39
13
8.40<9.27
3
TOTAL
42
Xi
Propiedades de la media aritmética
• Propiedad 1. La suma de las desviaciones de
los valores de la variable respecto a la media
aritmética es igual a cero. Expresado
matemáticamente, tendremos:
• Propiedad 2. La suma de los cuadrados de las
desviaciones de todos los valores con respecto
a la media es mínima. Cuya expresión
matemática es:
• Propiedad 3. Dados k conjuntos de datos con
sus medias X1, X2, . . . , X k y con n1 ,n2 , . . .,
nk observaciones, respectivamente, la media
global de todos los datos se obtiene mediante
la media ponderada, cuya expresión
matemática es:
• Propiedad 4. La media aritmética de una
constante por una variable, es igual al
producto de la constante por la media
aritmética de la variable. Esto es, si yi = Cxi i =
1,...,n, entonces Y = C X
• Ejemplo:
• Propiedad 5. Si a cada elemento de la muestra
se le suma una constate , la nueva media es
igual a la media de la variable más la
constante. Esto es, si yi = xi + C i = 1,...,n
entonces Y = X +C
• Ejemplo:
• Ejemplo: Como parte de una tarea de laboratorio de
nutrición, 15 estudiantes de tercer año de la Escuela
Académico Profesional de Nutrición de la UES matriculados
el año académico 2004, encontraron el número de calorías
(X ) de una porción de lasagña y obtuvieron los siguientes
valores:
29 35 47 18 22 30 51 62 15 42 46 53 16 27 33
• a) Encontraremos la media aritmética del número de
calorías.
• b) Al acabar el trabajo, los estudiantes se informaron que el
instrumento de medición que usaron estaba mal calibrado
y marcó en cada caso 300 calorías por debajo de su valor.
• Encontraremos la media aritmética de los nuevos valores
de calorías.
• b) Sumamos a todas las observaciones de la
variable X la constante C = 300 calorías, y los
nuevos valores de calorías (Y ) es como sigue:
• 335 347 318 322 330 351 362 315 342 346
353 316 327 333
• El cálculo de la media aritmética de los nuevos
valores de calorías se podrá simplificar
aplicando la propiedad 5, esto es:
Mediana
• Definición
Dado x1,....,xn observaciones de la variable X,
una vez ordenadas las observaciones en forma
creciente, la mediana es el valor o punto
medio que supera al 50 por ciento de los
valores observados de la variable y es
superado por el restante 50 por ciento. La
forma de obtener el valor de la mediana
depende del número de observaciones.
• Pasos para determinar la mediana:
1. Ordenar los datos de menor a mayor
2. Si n es impar la mediana es el valor de la
variable que ocupa la posición i=(n+1)/2
de las observaciones ordenadas.
3. Si n es par la mediana es el promedio
entre los valores de la variable que
ocupa la posición i=(n+1)/2 de las
observaciones ordenadas.
• Ejemplos:
• Si la muestra es de tamaño impar, como por
ejemplo: 13 11 19 20 18 21 23
• Si el tamaño de la muestra es par, como por
ejemplo: 10 16 4 9 13 17 la mediana es el
promedio entre
• Datos agrupados en intervalos de clase y
presentados en tabla de frecuencias Si los datos
están en una distribución de frecuencias, para
calcular la mediana se seguirán los siguientes
pasos:
• 1) Encontrar las frecuencias absolutas
acumuladas
• 2) Encontrar n/2
• 3) En la columna de las frecuencias absolutas
acumuladas, ubicar n/2
• 4) Determinar la clase mediana y encontrar el
valor de la mediana de acuerdo con la fórmula
siguiente:
• Donde Li: es el limite inferior de la clase
mediana
• Faa es la frecuencia acumulada anterior a la
clase mediana
• Fi es la frecuencia absoluta de la clase
mediana
• C es el ancho de clases
Paso 4. Los datos de los pesos de 50 personas se
presenta en la tabla de frecuencias a continuación
calcular el peso promedio
PESOS
Frec. Abs.
Faa
80<89
2
2
90<99
3
5
100<109
9
14
110<119
13
27
120<129
13
40
130<139
7
47
140<149
3
50
TOTAL
50
•
•
•
•
•
•
Moda
Definición: La moda es el valor de la variable
que se repite con mayor frecuencia.
Se expresa como: Mo
Ejemplo: Obtengamos la moda para los
siguientes conjuntos de datos:
a) 10 11 11 12 13 09 15
b) 10 11 12 13 09 15
c) 11 11 11 12 12 12 05 04
• Cuando todas las puntuaciones de un
conjunto de datos tienen la misma
frecuencia, éste no tiene moda. También
existen situaciones donde se tiene más
de una moda, en tal caso diremos que la
distribución de frecuencias es bimodal,
trimodal, o multimodal.
Moda para datos agrupados
• Para identificar el valor de la moda debe
observarse la columna de las frecuencias
absolutas y seleccionar la mayor de ellas.
Luego utilizamos la fórmula siguiente:
Mo=Li+ [a/(a+b)]C
Donde a=fi-fi-1, b=fi-fi+1
fi: frecuencia absoluta de la clase modal
fi-1: frecuencia absoluta anterior a la clase modal
fi+1: frecuencia absoluta posterior a la clase modal
Ejemplo: Las cifras de sobrepeso, en kilogramos, de 42
ejecutivos que han ingresado a un programa de dieta,
se dan en el cuadro a continuación: calcule la media, la
mediana y la moda
Clases (kg)
0<6
6<12
12<18
18<24
24<30
Total
fa ó fi
4
10
18
7
3
42
Fi
Xi
GRACIAS POR SU
ATENCIÓN