Estadistica_Descriptiva3.0 - Red de Profesores de Matemática

Download Report

Transcript Estadistica_Descriptiva3.0 - Red de Profesores de Matemática

Estadística
Descriptiva
Prof. Isaías Correa M.
Objetivos:
• Ordenar y agrupar datos en una tabla.
• Construir histogramas y polígonos de frecuencias,
basados en los datos recopilados.
• Calcular e interpretar las medidas de tendencia
central.
• Aplicar la Estadística Descriptiva en la resolución
de problemas de la vida real.
• Analizar gráficos y tablas de datos.
Contenidos
1. Definición:
1.1 Estadística
1.2 Población
1.3 Muestra
1.4 Variable estadística, cualitativa y cuantitativa
2. Distribución de frecuencias
2.1 Distribución de frecuencias en datos NO agrupados
2.2 Distribución de frecuencias en datos agrupados
3. Gráficos Estadísticos
3.1 Gráfico de barras
3.2 Histogramas
3.3 Polígono de Frecuencias
3.4 Gráficos Circulares
4. Medidas de Tendencia Central
4.1 Moda
4.2 Mediana
4.3 Media Aritmética o Promedio
5. Medidas de dispersión
5.1 Desviación Típica o Estándar
5.2 Varianza
6. Medidas de Posición
6.1 Percentiles
6.2 Deciles
6.3 Cuartiles
1. Definición:
1.1 Estadística
Es una herramienta matemática que permite recopilar,
organizar, presentar y analizar datos obtenidos de un
estudio estadístico.
1.2 Población
Colección o conjunto de personas, objetos o eventos que
poseen características comunes, cuyas propiedades serán
analizadas.
1.3 Muestra
Subconjunto de la población que comparte una determinada
característica.
1.4 Variable estadística
Información a recopilar, en ella se describen las
características de la muestra. Existen dos tipos:
Cualitativas y Cuantitativas
• Cualitativas:
Las variables cualitativas tienen características no numéricas.
Por ejemplo: color de pelo, sexo, estado civil, etc.
• Cuantitativas:
Las variables cuantitativas tienen características numéricas.
Por ejemplo: edad, estatura, número de hijos, etc.
Cuantitativa discreta: Son aquellas a las que se les puede
asociar un número entero y es imposible fraccionar.
Por ejemplo: número de hijos, número de automóviles.
Cuantitativa continua: Son aquellas a las que se les puede
asociar cualquier número real. Por ejemplo: peso, estatura,
tiempo.
2. Distribución de frecuencias
Ordenamiento de datos cuando en un estudio estadístico se
recopila una gran cantidad de ellos .
Existen dos tipos de distribución de frecuencias, con datos no
agrupados y con datos agrupados.
Rango: Es la diferencia entre el dato mayor y el menor.
2.1 Distribución en datos NO agrupados
Se utiliza preferentemente cuando las opciones de la variable
son pocas .
Ejemplo:
Al lanzar un dado 10 veces, se obtuvo la siguiente información:
1–6–4–3–1–2–6–5–1–3
Frecuencia absoluta: Corresponde a la cantidad de
veces
que se encuentra un dato en una muestra.
Rango: 6 – 1 =5
1–6–4–3–1–2–6–5–1–3
Al construir la tabla de frecuencias, se obtiene:
Número
Frecuencia
1
3
2
1
3
2
4
1
5
1
6
2
Total datos:
10.
Al sumar la columna frecuencia, se
obtiene el total de datos (n).
2.2 Distribución en datos agrupados
Se utiliza cuando la variable ofrece una gran gama de
posibilidades, si es cuantitativa continua, debemos agrupar los
datos en intervalos semi-abiertos, excepto el último, que es
cerrado.
Al agrupar los datos en intervalos, se debe calcular la
“marca de clase”.
Corresponde al promedio entre
los extremos del intervalo.
Ejemplo:
Peso (Kg.)
Frecuencia
Marca de
clase
[55,59[
2
57
[59,63[
5
61
[63,67[
3
65
[67,71[
7
69
[71,75]
4
73
R
a= NC
a: Amplitud=Longitud del Intervalo
R: Rango
NC: Número de Clases
3. Gráficos estadísticos
3.1 Gráfico de Barras
Se utiliza para variables cualitativas o variables discretas.
Cada variable se representa mediante una barra
proporcional a su frecuencia.
Ejemplo:
3.2 Histogramas
Se utilizan para datos agrupados.
Cada intervalo se representa mediante una barra proporcional
a su frecuencia.
Ejemplo:
La distribución del número de horas que duraron
encendidas 200 ampolletas está dada en el gráfico
siguiente. (Ensayo PSU, 2004)
3.3 Polígono de frecuencia
Es la línea que une los puntos correspondientes a las
frecuencias de cada dato.
Ejemplo:
3.4 Gráficos circulares
Estos gráficos permiten visualizar la distribución de los datos
en forma de porcentaje sobre un total.
Ejemplo:
4. Medidas de Tendencia Central
4.1 Moda
Es el dato que más se repite, es decir, el que tiene
mayor frecuencia.
Ejemplo: Para Datos no agrupados
De acuerdo a la gráfica,
la Moda es 15.
Frecuencia
6
5
4
3
2
1
Temperatura (º C)
8
10
12
15
18
21
25
Para datos agrupados:
Datos Discretos: En este caso, observaremos directamente la tabla
Ejemplo 1: La siguiente tabla muestra datos discretos
Número
Frecuencia
1
3
2
1
3
2
4
1
5
1
6
2
Mo =1
,pues 1 es el dato que más se repite
Datos Continuos: Para este caso, debemos utilizar la siguiente fórmula,
fi+1
Mo =liminf +
a
fi-1 +fi+1
Donde:
lim : límite inferior de la clase modal a amplitud de la clase
inf
fi+1 :frecuencia absoluta de la clase modal siguiente.
fi-1
:frecuencia absoluta de la clase modal anterior
4.2 Mediana
Corresponde al “valor central” de todos los datos
ordenados de una muestra. Se denota por: M
e
 Para datos No Agrupados:
La muestra debe ser ordenada en forma ascendente o
descendente.
Cuando la muestra tiene un número par de datos, la
mediana corresponderá al promedio de los dos datos
centrales.
Veamos el siguiente caso:
Ejemplo 1:
Los puntajes de 8 alumnos en el 5° ensayo de Matemática son
los siguientes:
650 – 556 – 722 – 478 – 570 – 660 – 814 – 670
Solución:
Al ordenarlos de menor a mayor:
478 – 556 –570 – 650 – 660 – 670 – 722 – 814
Como la cantidad de datos es par entonces se promedian los
Dos centrales
M e = 650 + 660 = 655
2
 Para Datos Agrupados Discretos
Veamos el siguiente ejemplo:
Ejemplo 2:
Determinar la mediana a partir del siguiente gráfico:
Xi
fi
N° Alumnos
6
5
5
4
3
3
2
1
2
2
1
1
1
2
2
3
Nota
4
5
6
7
Solución:
Xi
fi
Fac
1
1
1
2
2
3
3
1
4
4
4
8
5
3
11
6
3
14
7
2
16
Para determinar el total de datos, debemos sumar las
frecuencias. En este caso, el total de datos es 16 y se dividen
por 2, entonces se obtiene 8.
Luego, los valores centrales están ubicados en las
posiciones 8ª y 9ª por ser una cantidad par de datos. Por
lo que se promedian los datos correspondientes X i (4 y 5).
Por lo tanto, la mediana es 4,5.
 Para Datos Agrupados Continuos:
Para este caso utilizaremos la siguiente fórmula:
Me =liminf +
n -F
(2
ac
fi
i-1)a
Ejemplo: Usaremos un ejemplo anterior, el caso de los pesos de 21 alumnos
de un curso.
Clase
Intervalo
1
Yi
fi
Fac
[55,59[
57
2
2
2
[59,63[
61
5
7
3
[63,67[
65
3
10
4
[67,71[
69
7
17
5
[71,75]
73
4
21
Me =67+
Me =67,285
( 21
- 10)4
2
7
1° Se obtiene la Frecuencia
Acumulada y el total de datos “n”.
2° Se dividen los datos por 2 (n/2) y se
Obtiene 10,5.
3° Se ubica el dato en la tabla, éste se
encuentra en la clase 4.
4° Esto permite, identificar la clase
de la mediana y los elementos que se
necesitan.
4.3 Media aritmética o promedio (x)
Es el estadígrafo que nos permite compararnos con el grupo. Se
obtiene al dividir la suma de todos los valores por el total de datos.
n
o Para datos No Agrupados:
X=
Ejemplo 1:
x
i=1
i
n
Los puntajes de 8 alumnos en el 5° simulacro son los
siguientes:
650 – 556 – 722 – 478 – 570 – 660 – 814 – 670
Luego, la media aritmética (promedio) es:
x = 650 + 556 + 722 + 478 + 570 + 660 + 814 + 670
8
x = 640
Por lo tanto, el promedio de los puntajes es 640.
n
o Para Datos Agrupados Discretos:
Utilizaremos la siguiente fórmula:
Ejemplo 2:
fi
X=
x
i=1
i
fi
n
Determinar la media aritmética a partir del siguiente
gráfico:
N° Alumnos
6
5
4
Xi
1
2
3
4
5
6
7
fi
1
2
1
5
3
2
2
3
2
1
Nota
1
2
3
4
5
6
7
Xi
Solución:
Para determinar el total de datos, debemos sumar las
frecuencias. En este caso, el total de datos es 16.
Para determinar la media aritmética, debemos multiplicar
cada dato por su frecuencia, sumar estas cantidades y el
resultado dividirlo por el total de datos (n).
Por lo tanto:
x = 1·1 + 2·2 + 3·1 + 4·5 + 5·3 + 6·2 + 7·2
16
x = 1 + 4 + 3 + 20 + 15 + 12 + 14
16
x = 69 =4,3125
16
x ≈ 4,3
n
o Para Datos Agrupados Continuos:
Para este caso se utiliza la siguiente fórmula:
X=
Y
i
i=1
fi
n
Ejemplo 3: Veamos este caso analizado anteriormente
Clase
Intervalo
Yi
fi
1
[55,59[
57
2
2
[59,63[
61
5
3
[63,67[
65
3
4
[67,71[
69
7
5
[71,75]
73
4
X=
57  2+61  5+65  3+69  7+73  4 1389
=
=66,142
21
21
5. Medidas de dispersión
Indican el alejamiento de los datos con respecto a la media aritmética.
5.1 Desviación Típica o Estándar
Es el promedio de las distancias de cada dato c/r a la media aritmética.
A mayor desviación estándar, mayor dispersión en los datos y a menor
desviación estándar, mayor homogeneidad de ellos.
n
 Para Datos No Agrupados
σ=
 (x - x)
2
i
i=1
n
n
 Para Datos Agrupados Discretos
σ=
 (x - x)
2
i=1
n
n
 Para Datos Agrupados Continuos
5.2 Varianza
σ=
Es el cuadrado de la desviación estándar
Obs. La varianza se calcula igual en todos los casos
fi
i
 (y - x)
i=1
2
i
n
V =σ2
fi
6. Medidas de Posición:
Percentiles, Deciles y Cuartiles
6.1 Percentiles: Son los valores de la muestra que la dividen en 100
partes iguales. Los percentiles dan los valores correspondientes al 1%, al
2%... y al 99% de los datos.
Obs: - El percentil 99 supera 99% de los datos y es superado a su vez
por el 1% restante.
- P50 coincide con la mediana.
- Datos No Agrupados
* cuando n es par:
k n
100
* Cuando n es impar:
k  (n+1)
100
- Datos Agrupados:
kn
(100
-Fac-1)  a
Pk =liminf +
fi
Pk : Es el número del percentil
k=1, 2, ….99
6.2 Deciles: Son los nueve valores de la muestra que dividen a los datos en
10 partes iguales.
- Para datos no agrupados:
* Cuando n es par.
l n
10
Dl
* Cuando n es impar:
l  (n+1)
10
- Para datos agrupados:
Dl =liminf +
ln
(10
-Fac-1 )  a
fi
: Es el número del decil
l=1,2,3,….,9
6.3 Cuartiles: Corresponden a los tres valores que dividen a la
muestra en cuatro partes iguales.
Obs. El cuartil dos corresponde a la mediana.
- Para datos no agrupados:
* Cuando n es par.
m n
4
- * Cuando n es impar.
m  (n+1)
4
- Para datos no agrupados:
* Cuando n es impar.
( m4n -Fac-1 )  a
Qm =liminf +
fi
Qm : es el número del cuartil
m=1, 2 y 3
www.sectormatematica.cl
www.redmatematica.bligoo.cl