Transcript Estadistica Basica Sesion 2
Curso de Estadística Básica
SESION 2 PRESENTACIÓN GRÁFICA DE DATOS MCC. Manuel Uribe Saldaña MCC. José Gonzalo Lugo Pérez
Estadística Básica
Objetivo
Aprender datos cómo presentar y describir conjuntos de
Estadística Básica
Agenda Sesión 2
• Presentación gráfica de datos – Diagramas de pastel y gráficas de barras – – – Diagrama de Pareto Gráfica de Puntos Distribución de frecuencia – Histogramas
Estadística Básica
Resultados del examen de matemáticas…
Calificación: 78 E: ¿Cuál fue la calificación promedio del examen?
I: el promedio del salón fue de 68 E: ¿cuán próxima del máximo está mi calificación?
I: las calificaciones variaron de 42 a 87 puntos.
42 68 78 87
Estadística Básica
Resultados del examen de matemáticas…
Calificación: 78 E: ¿Cómo están distribuidas las calificaciones?
I: la mitad del grupo obtuvo calificaciones entre 65 y 75.
Conclusión del estudiante: su calificación es buena
Estadística Básica
Reflexión…
• Conjunto de datos:
Calificaciones del examen
• Estadísticas descriptivas:
calificación promedio y calificaciones máxima y mínima
• Con esta información los estudiantes pueden obtener conclusiones sobre su éxito relativo
Estadística Básica
Medidas de tendencia central
Estadística descriptiva
Medidas de dispersión Medidas de posición Tipos de distribución
Estadística Básica
Gráficas
• • • • • Una vez recolectado los datos de la muestra, es necesario “familiarizarse” con ellos.
Aplicar una produzca una técnica inicial exploratoria de análisis de datos que representación visual.
Las representaciones visuales revelan patrones de comportamiento de la variable de estudio.
Existen muchas formas gráficas (visuales) para describir los datos.
El método que se aplique es determinado por el tipo de datos y el concepto a representar.
NOTA: Cuando se elabora una respuesta correcta. El juicio del analista y las circunstancias que rodean al problema representación gráfica no existe solamente una desempeñan un papel primordial en el desarrollo de la gráfica.
Estadística Básica
Diagramas de pastel
• Gráficas que se utilizan para resumir
atributo datos de (cualitativos).
Los diagramas de pastel muestran la cantidad de datos que pertenecen a cada categoría como una parte proporcional de un círculo.
Estadística Básica
Ejemplo
En la tabla se muestra el de número de casos de cada tipo operación realizada en el Hospital General, el año pasado
Tipo de operación
Torácica Huesos y articulaciones Ojos, oídos, nariz y garganta General Abdominal Urológicas Proctológicas Neurocirugía
Total Número de casos
20 45 58 98 115 74 65 23 498
Estadística Básica
Ejemplo
Estos datos se muestran en un diagrama de pastel, donde cada tipo de operación está representado por una proporción relativa del círculo identificada con un porcentaje.
Estadística Básica
Diagramas de barras
• Gráficas que se utilizan para resumir
atributo datos de (cualitativos).
Las gráficas de barras muestran la cantidad de datos que pertenecen a cada categoría como áreas rectangulares de tamaño proporcional.
Estadística Básica
Ejemplo
En la figura se presentan los mismos datos sobre el gráfica de barras “tipo de operación” en forma de
Estadística Básica
Pregunta
• En su opinión, con qué gráfica, diagrama de pastel o gráfica de barras, se obtiene una mejor representación de la información?
Estadística Básica
Respuesta
• La gráfica de círculo facilita la comparación visual de los tamaños relativos de las partes entre sí y el tamaño de cada parte con respecto al todo.
Estadística Básica
Diagrama de Pareto
Gráfica de barras con éstas dispuestas de la categoría más numerosa a la menos numerosa. Incluye una gráfica hecha a base de rectas que muestra los porcentajes acumulados y la cantidad de datos representada por cada barra. Es una representación gráfica de los datos obtenidos sobre un problema, que ayuda a identificar cuáles son los problemas prioritarios que hay que tratar
Estadística Básica
Ejemplo
Estadísticas de delitos por animadversión cometidos en 1993
4500 4000 3500 3000 2500 2000 1500 1000 500 0 Cantidad Porcentaje acumulado Racial 4168 61,78% Religioso 1189 79,41% Sexual 806 91,36% Étnico 583 100,00% 120,00% 100,00% 80,00% 60,00% 40,00% 20,00% 0,00%
Estadística Básica
Consejos para elaborar y usar los diagramas de Pareto
• • • • No es conveniente represente un porcentaje de los se debe utilizar un que la categoría de “otros” más altos. De ser así, método diferente de clasificación.
Es preferible representar los datos (si es posible) en valores monetarios.
Si un factor se puede solucionar afrontarse importancia.
de inmediato aunque fácilmente debe sea de poca Es imprescindible realizar un diagrama de causas si se quieren realizar mejoras
Estadística Básica
Ejercicio
1.
Se tienen los datos de una inspección final de defectos para la línea de ensamble A12 organizados en la siguiente tabla: 2.
Representar los datos en un diagrama de pareto
Defecto
Manchado
Rayado Astillado Doblado Abollado Otros Cantidad
56 45 23 12 8 6
Estadística Básica
Pareto de la línea de ensamble A12
Defectos del producto
60 50 40 30 20 10 0 Cantidad Porcentaje acumulado Manchado 56 37,3% Rayado 45 67,3% Astillado 23 82,7% Doblado 12 90,7% Abollado 8 96,0% 120,0% 100,0% 80,0% 60,0% Otros 6 100,0% 40,0% 20,0% 0,0%
Estadística Básica
Ejercicio propuesto
Utilizando como herramienta el diagrama de Pareto, analice las por rechazos en una pérdidas fábrica de papel, teniendo en cuenta que se han detectado los conceptos que se muestran en la tabla siguiente, en la que también se indican los costes asociados a cada concepto.
Estadística Básica
Gráficas para datos cuantitativos
• Una razón fundamental para elaborar una gráfica de datos cuantitativos es mostrar la distribución de éstos.
Distribución • Patrón de variabilidad mostrado por los datos de una variable. La distribución muestra la frecuencia de cada valor de la variable.
Estadística Básica
Gráfica de puntos
• Presenta los datos de una muestra mediante la representación de cada porción de datos con un punto ubicado a lo largo de una escala. Esta escala puede ser vertical u horizontal. La frecuencia de los valores está representada a lo largo de la otra escala.
19 Calificaciones del examen
3,5 3 2,5 2 1,5 1 0,5 0 0 20 40 60
Calificación
80 100 120
Estadística Básica
Gráfica de puntos
• La gráfica de puntos es una técnica que conviene utilizar al inicio del análisis de los datos. Esta representación da por resultado una imagen y una clasificación de los datos en orden numérico. (Clasificar datos es ordenarlos según el valor numérico)
Estadística Básica
Ejercicio
Se eligió una muestra aleatoria de 50 estudiantes universitarios. Sus pesos fueron obtenidos de sus registros médicos. En la siguiente tabla se muestran los datos resultantes: obtener el diagrama de puntos y una conclusión Estudiante Sexo: Peso Estudiante Sexo: Peso Estudiante Sexo: Peso Estudiante Sexo: Peso Estudiante Sexo: Peso Masculino (M) Femenino (F) Masculino (M) Femenino (F) Masculino (M) Femenino (F) Masculino (M) Femenino (F) Masculino (M) Femenino (F) 1 F 98 11 M 177 21 M 188 31 F 101 41 F 142 2 M 150 12 M 186 22 M 176 32 M 143 42 M 184 3 F 108 13 M 191 23 F 118 33 M 145 43 F 120 4 M 158 14 F 128 24 M 168 34 F 108 44 M 170 5 M 162 15 F 135 25 F 115 35 M 155 45 M 195 6 F 112 16 M 195 26 F 115 36 F 110 46 F 132 7 F 118 17 F 137 27 M 162 37 M 154 47 F 129 8 M 167 18 M 205 28 M 157 38 F 116 48 M 215 9 M 170 19 M 190 29 M 154 39 M 161 49 M 176 10 F 120 20 F 120 30 M 148 40 M 165 50 M 183
Estadística Básica
Distribuciones de frecuencia
Los listados de grandes conjuntos de datos no presentan una imagen valiosa. A veces se desea condensar los datos en una forma más manejable. Esto puede lograrse con ayuda de una
distribución de frecuencia.
Distribución de frecuencias
Listado, a menudo expresado en forma de diagrama, que asocia cada valor de una variable con su frecuencia.
Estadística Básica
Ejemplo
Se tiene el siguiente conjunto de datos: 3 4 4 2 2 4 3 1 2 1 2 3 3 2 0 3 2 2 2 1 Si
x
representa una variable, puede usarse una distribución de frecuencias para representar este conjunto de datos enumerando los valores
x
con sus frecuencias. Por ejemplo, el valor 1 se presenta tres veces en la muestra; por tanto, la frecuencia de x = 1 es 3.
x f
0 1 2 3 4 1 3 8 5 3
Estadística Básica
Frecuencia
La frecuencia
f
es el número de veces que aparece el valor
x
en la muestra.
La tabla anterior es una porque cada valor de
x
distribución de frecuencias no agrupadas
, en la distribución permanece solo. Cuando un gran conjunto de datos tiene muchos valores valores en un conjunto de
clases
x
distintos, es posible agrupar los y elaborar una
distribución de frecuencias agrupadas
.
Estadística Básica
Ejercicio
Forme una distribución de frecuencias no agrupadas de los datos resultantes: 1, 2, 1, 0, 4, 2, 1, 1, 0, 1, 2, 4
Estadística Básica
Distribución de frecuencias Agrupadas y No Agrupadas
De un grupo grande se extrajo aleatoriamente una muestra de 19 calificaciones de un examen: 76 86 74 84 82 62 96 76 66 78 76 92 78 82 72 74 52 88 68
Calificaciones
84 86 88 92 96 52 62 66 68 72 74 76 78 82 Total
Frecuencia
1 1 1 1 1 1 1 1 1 1 2 3 2 2 19 50 o más hasta menos que 60 60 o más hasta menos que 70 70 o más hasta menos que 80 80 o más hasta menos que 90 90 o más hasta menos que 100 Distribución de frecuencias no agrupadas
Clase
50 ≤ x < 60 60 ≤ x < 70 70 ≤ x < 80 80 ≤ x < 90 90 ≤ x < 100 Total
Frecuencia
1 3 8 5 2 19 Distribución de frecuencias agrupadas
Estadística Básica
Distribución de frecuencias Agrupadas y No Agrupadas
19 Calificaciones del examen
3,5 3 2,5 2 1,5 1 0,5 0 0 20 40 60
Calificación
80 19 Calificaciones del examen 100 120 9 8 4 3 2 1 0 7 6 5 0 20 40 60
Calificacion
80 100 120 Distribución de frecuencias no agrupadas Distribución de frecuencias agrupadas
Estadística Básica
Procedimiento para elaborar una distribución de frecuencias agrupadas
1. Cada clase debe ser del mismo ancho 2. Las clases deben estar dispuestas de modo que no se superpongan y que cada porción de información pertenezca exactamente a una clase 3.
4.
La raíz cuadrada de
n
es un lineamiento razonable para el número de clases con muestras de menos de 150 datos.
Utilizar un sistema que aproveche un patrón numérico, para garantizar precisión 5. Cuando sea conveniente, un ancho de clase par suele ser ventajoso
Estadística Básica
Ejemplo
Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación se muestran los puntajes: 60 90 77 58 72 47 77 39 78 86 82 86 90 89 50 95 58 63 44 94 88 64 68 55 92 72 95 97 85 80 67 74 70 82 91 66 72 64 83 75 68 88 70 72 76 98 74 70 77 78
Estadística Básica
Procedimiento
1.
Identifique los puntajes máximo y mínimo y determine el rango.
Máx = 98, Mín = 39.
Rango = Máx – Mín = 98 – 39 = 59
2.
Elija un producto número de clases
mc m
y un ancho de clase sea ligeramente mayor que el rango
c
de modo que el
m = raíz cuadrada de n = 50 m = 7 c = 10 mc = 70 Es mayor que el rango = 59 Estadística Básica
Procedimiento
3.
Elija un punto inicial, que debe ser algo menor que el puntaje bajo (min). Posteriormente se cuenta a partir de incrementos del ancho de clase. Cada denomina límites de clase.
más ahí en número obtenido se 35 ≤ x < 45 45 ≤ x < 55 55 ≤ x < 65 65 ≤ x < 75 75 ≤ x < 85 85 ≤ x < 95 95 ≤ x < 105
Estadística Básica
Procedimiento
4.
Una vez establecidas las clases, es necesario clasificar los datos en dichas clases. El método utilizado para realizar la clasificación depende del formato actual de los datos: si los datos están ordenados, es posible contar las frecuencias; si los datos no ordenados, se datos, es de utilidad usar un diagrama estándar.
están efectúa un conteo de éstos para determinar los números de frecuencia. Cuando se efectúa la clasificación de los
Número de clases
5 6 7 1 2 3 4
Límites
35 ≤ x < 45 45 ≤ x < 55 55 ≤ x < 65 65 ≤ x < 75 75 ≤ x < 85 85 ≤ x < 95 95 ≤ x < 105
Frecuencia
2 2 7 13 11 11 4 50
Estadística Básica
Notas
1. Si se han ordenado los datos (en forma de lista, de puntos o gráfica representación de tallo y hojas) el conteo es innecesario; simplemente se cuentan los datos que pertenecen a cada clase.
2. Si los datos no están ordenados, debe tenerse cuidado al efectuar el conteo.
3. La frecuencia
f
para cada clase es el que pertenecen a esa clase.
número de datos 4. La suma de frecuencias debe ser exactamente igual al número de datos
n (n = Σf).
Esta sumatoria es una verificación aceptable.
Estadística Básica
Notas
5.
Cada clase requiere un solo valor numérico para representar todos los valores de datos que caen en esa clase. La
marca de clase
(algunas veces denominada punto medio de clase) es el valor numérico que está exactamente a la mitad de ésta y se encuentra al sumar los límites de clase y dividirlo entre 2.
Número de clases
1 2 3 4 5 6 7
Límites
35 ≤ x < 45 45 ≤ x < 55 55 ≤ x < 65 65 ≤ x < 75 75 ≤ x < 85 85 ≤ x < 95 95 ≤ x < 105
Frecuencia
2 2 7 13 11 11 4 50
Marca de clase
40 50 60 70 80 90 100
Estadística Básica
Histograma
Gráfica de barras que representa una distribución de frecuencias de una variable cuantitativa. Un histograma está integrado por los siguientes componentes: 1. Un título, que identifica la población o la muestra de interés 2. Una escala vertical, que identifica las frecuencias que hay en las diversas clases 3. Una escala horizontal, que identifica la variable valores de los
x
. Los límites de una clase de las marcas de clase deben identificarse a lo largo del eje cualquier
x
. El empleo de método para identificar el eje presenta mejor a la variable.
Estadística Básica
Ejemplo
50 puntajes del examen final de estadística básica
14 12 10 8 6 4 2 0 40 50 60 70
Puntaje
80 90 100
Estadística Básica
Forma de los histogramas
Simétrico, normal o triangular Uniforme o rectangular Sesgado a la derecha Sesgado a la izquierda En forma de J Bimodal
Estadística Básica