Estadistica Basica Sesion 2

Download Report

Transcript Estadistica Basica Sesion 2

Curso de Estadística Básica

SESION 2 PRESENTACIÓN GRÁFICA DE DATOS MCC. Manuel Uribe Saldaña MCC. José Gonzalo Lugo Pérez

Estadística Básica

Objetivo

Aprender datos cómo presentar y describir conjuntos de

Estadística Básica

Agenda Sesión 2

• Presentación gráfica de datos – Diagramas de pastel y gráficas de barras – – – Diagrama de Pareto Gráfica de Puntos Distribución de frecuencia – Histogramas

Estadística Básica

Resultados del examen de matemáticas…

Calificación: 78 E: ¿Cuál fue la calificación promedio del examen?

I: el promedio del salón fue de 68 E: ¿cuán próxima del máximo está mi calificación?

I: las calificaciones variaron de 42 a 87 puntos.

42 68 78 87

Estadística Básica

Resultados del examen de matemáticas…

Calificación: 78 E: ¿Cómo están distribuidas las calificaciones?

I: la mitad del grupo obtuvo calificaciones entre 65 y 75.

Conclusión del estudiante: su calificación es buena

Estadística Básica

Reflexión…

• Conjunto de datos:

Calificaciones del examen

• Estadísticas descriptivas:

calificación promedio y calificaciones máxima y mínima

• Con esta información los estudiantes pueden obtener conclusiones sobre su éxito relativo

Estadística Básica

Medidas de tendencia central

Estadística descriptiva

Medidas de dispersión Medidas de posición Tipos de distribución

Estadística Básica

Gráficas

• • • • • Una vez recolectado los datos de la muestra, es necesario “familiarizarse” con ellos.

Aplicar una produzca una técnica inicial exploratoria de análisis de datos que representación visual.

Las representaciones visuales revelan patrones de comportamiento de la variable de estudio.

Existen muchas formas gráficas (visuales) para describir los datos.

El método que se aplique es determinado por el tipo de datos y el concepto a representar.

NOTA: Cuando se elabora una respuesta correcta. El juicio del analista y las circunstancias que rodean al problema representación gráfica no existe solamente una desempeñan un papel primordial en el desarrollo de la gráfica.

Estadística Básica

Diagramas de pastel

• Gráficas que se utilizan para resumir

atributo datos de (cualitativos).

Los diagramas de pastel muestran la cantidad de datos que pertenecen a cada categoría como una parte proporcional de un círculo.

Estadística Básica

Ejemplo

En la tabla se muestra el de número de casos de cada tipo operación realizada en el Hospital General, el año pasado

Tipo de operación

Torácica Huesos y articulaciones Ojos, oídos, nariz y garganta General Abdominal Urológicas Proctológicas Neurocirugía

Total Número de casos

20 45 58 98 115 74 65 23 498

Estadística Básica

Ejemplo

Estos datos se muestran en un diagrama de pastel, donde cada tipo de operación está representado por una proporción relativa del círculo identificada con un porcentaje.

Estadística Básica

Diagramas de barras

• Gráficas que se utilizan para resumir

atributo datos de (cualitativos).

Las gráficas de barras muestran la cantidad de datos que pertenecen a cada categoría como áreas rectangulares de tamaño proporcional.

Estadística Básica

Ejemplo

En la figura se presentan los mismos datos sobre el gráfica de barras “tipo de operación” en forma de

Estadística Básica

Pregunta

• En su opinión, con qué gráfica, diagrama de pastel o gráfica de barras, se obtiene una mejor representación de la información?

Estadística Básica

Respuesta

• La gráfica de círculo facilita la comparación visual de los tamaños relativos de las partes entre sí y el tamaño de cada parte con respecto al todo.

Estadística Básica

Diagrama de Pareto

Gráfica de barras con éstas dispuestas de la categoría más numerosa a la menos numerosa. Incluye una gráfica hecha a base de rectas que muestra los porcentajes acumulados y la cantidad de datos representada por cada barra. Es una representación gráfica de los datos obtenidos sobre un problema, que ayuda a identificar cuáles son los problemas prioritarios que hay que tratar

Estadística Básica

Ejemplo

Estadísticas de delitos por animadversión cometidos en 1993

4500 4000 3500 3000 2500 2000 1500 1000 500 0 Cantidad Porcentaje acumulado Racial 4168 61,78% Religioso 1189 79,41% Sexual 806 91,36% Étnico 583 100,00% 120,00% 100,00% 80,00% 60,00% 40,00% 20,00% 0,00%

Estadística Básica

Consejos para elaborar y usar los diagramas de Pareto

• • • • No es conveniente represente un porcentaje de los se debe utilizar un que la categoría de “otros” más altos. De ser así, método diferente de clasificación.

Es preferible representar los datos (si es posible) en valores monetarios.

Si un factor se puede solucionar afrontarse importancia.

de inmediato aunque fácilmente debe sea de poca Es imprescindible realizar un diagrama de causas si se quieren realizar mejoras

Estadística Básica

Ejercicio

1.

Se tienen los datos de una inspección final de defectos para la línea de ensamble A12 organizados en la siguiente tabla: 2.

Representar los datos en un diagrama de pareto

Defecto

Manchado

Rayado Astillado Doblado Abollado Otros Cantidad

56 45 23 12 8 6

Estadística Básica

Pareto de la línea de ensamble A12

Defectos del producto

60 50 40 30 20 10 0 Cantidad Porcentaje acumulado Manchado 56 37,3% Rayado 45 67,3% Astillado 23 82,7% Doblado 12 90,7% Abollado 8 96,0% 120,0% 100,0% 80,0% 60,0% Otros 6 100,0% 40,0% 20,0% 0,0%

Estadística Básica

Ejercicio propuesto

Utilizando como herramienta el diagrama de Pareto, analice las por rechazos en una pérdidas fábrica de papel, teniendo en cuenta que se han detectado los conceptos que se muestran en la tabla siguiente, en la que también se indican los costes asociados a cada concepto.

Estadística Básica

Gráficas para datos cuantitativos

• Una razón fundamental para elaborar una gráfica de datos cuantitativos es mostrar la distribución de éstos.

Distribución • Patrón de variabilidad mostrado por los datos de una variable. La distribución muestra la frecuencia de cada valor de la variable.

Estadística Básica

Gráfica de puntos

• Presenta los datos de una muestra mediante la representación de cada porción de datos con un punto ubicado a lo largo de una escala. Esta escala puede ser vertical u horizontal. La frecuencia de los valores está representada a lo largo de la otra escala.

19 Calificaciones del examen

3,5 3 2,5 2 1,5 1 0,5 0 0 20 40 60

Calificación

80 100 120

Estadística Básica

Gráfica de puntos

• La gráfica de puntos es una técnica que conviene utilizar al inicio del análisis de los datos. Esta representación da por resultado una imagen y una clasificación de los datos en orden numérico. (Clasificar datos es ordenarlos según el valor numérico)

Estadística Básica

Ejercicio

Se eligió una muestra aleatoria de 50 estudiantes universitarios. Sus pesos fueron obtenidos de sus registros médicos. En la siguiente tabla se muestran los datos resultantes: obtener el diagrama de puntos y una conclusión Estudiante Sexo: Peso Estudiante Sexo: Peso Estudiante Sexo: Peso Estudiante Sexo: Peso Estudiante Sexo: Peso Masculino (M) Femenino (F) Masculino (M) Femenino (F) Masculino (M) Femenino (F) Masculino (M) Femenino (F) Masculino (M) Femenino (F) 1 F 98 11 M 177 21 M 188 31 F 101 41 F 142 2 M 150 12 M 186 22 M 176 32 M 143 42 M 184 3 F 108 13 M 191 23 F 118 33 M 145 43 F 120 4 M 158 14 F 128 24 M 168 34 F 108 44 M 170 5 M 162 15 F 135 25 F 115 35 M 155 45 M 195 6 F 112 16 M 195 26 F 115 36 F 110 46 F 132 7 F 118 17 F 137 27 M 162 37 M 154 47 F 129 8 M 167 18 M 205 28 M 157 38 F 116 48 M 215 9 M 170 19 M 190 29 M 154 39 M 161 49 M 176 10 F 120 20 F 120 30 M 148 40 M 165 50 M 183

Estadística Básica

Distribuciones de frecuencia

Los listados de grandes conjuntos de datos no presentan una imagen valiosa. A veces se desea condensar los datos en una forma más manejable. Esto puede lograrse con ayuda de una

distribución de frecuencia.

Distribución de frecuencias

Listado, a menudo expresado en forma de diagrama, que asocia cada valor de una variable con su frecuencia.

Estadística Básica

Ejemplo

Se tiene el siguiente conjunto de datos: 3 4 4 2 2 4 3 1 2 1 2 3 3 2 0 3 2 2 2 1 Si

x

representa una variable, puede usarse una distribución de frecuencias para representar este conjunto de datos enumerando los valores

x

con sus frecuencias. Por ejemplo, el valor 1 se presenta tres veces en la muestra; por tanto, la frecuencia de x = 1 es 3.

x f

0 1 2 3 4 1 3 8 5 3

Estadística Básica

Frecuencia

La frecuencia

f

es el número de veces que aparece el valor

x

en la muestra.

La tabla anterior es una porque cada valor de

x

distribución de frecuencias no agrupadas

, en la distribución permanece solo. Cuando un gran conjunto de datos tiene muchos valores valores en un conjunto de

clases

x

distintos, es posible agrupar los y elaborar una

distribución de frecuencias agrupadas

.

Estadística Básica

Ejercicio

Forme una distribución de frecuencias no agrupadas de los datos resultantes: 1, 2, 1, 0, 4, 2, 1, 1, 0, 1, 2, 4

Estadística Básica

Distribución de frecuencias Agrupadas y No Agrupadas

De un grupo grande se extrajo aleatoriamente una muestra de 19 calificaciones de un examen: 76 86 74 84 82 62 96 76 66 78 76 92 78 82 72 74 52 88 68

Calificaciones

84 86 88 92 96 52 62 66 68 72 74 76 78 82 Total

Frecuencia

1 1 1 1 1 1 1 1 1 1 2 3 2 2 19 50 o más hasta menos que 60 60 o más hasta menos que 70 70 o más hasta menos que 80 80 o más hasta menos que 90 90 o más hasta menos que 100 Distribución de frecuencias no agrupadas

Clase

50 ≤ x < 60 60 ≤ x < 70 70 ≤ x < 80 80 ≤ x < 90 90 ≤ x < 100 Total

Frecuencia

1 3 8 5 2 19 Distribución de frecuencias agrupadas

Estadística Básica

Distribución de frecuencias Agrupadas y No Agrupadas

19 Calificaciones del examen

3,5 3 2,5 2 1,5 1 0,5 0 0 20 40 60

Calificación

80 19 Calificaciones del examen 100 120 9 8 4 3 2 1 0 7 6 5 0 20 40 60

Calificacion

80 100 120 Distribución de frecuencias no agrupadas Distribución de frecuencias agrupadas

Estadística Básica

Procedimiento para elaborar una distribución de frecuencias agrupadas

1. Cada clase debe ser del mismo ancho 2. Las clases deben estar dispuestas de modo que no se superpongan y que cada porción de información pertenezca exactamente a una clase 3.

4.

La raíz cuadrada de

n

es un lineamiento razonable para el número de clases con muestras de menos de 150 datos.

Utilizar un sistema que aproveche un patrón numérico, para garantizar precisión 5. Cuando sea conveniente, un ancho de clase par suele ser ventajoso

Estadística Básica

Ejemplo

Se considera una muestra de 50 puntajes del examen final del curso de estadística básica. A continuación se muestran los puntajes: 60 90 77 58 72 47 77 39 78 86 82 86 90 89 50 95 58 63 44 94 88 64 68 55 92 72 95 97 85 80 67 74 70 82 91 66 72 64 83 75 68 88 70 72 76 98 74 70 77 78

Estadística Básica

Procedimiento

1.

Identifique los puntajes máximo y mínimo y determine el rango.

Máx = 98, Mín = 39.

Rango = Máx – Mín = 98 – 39 = 59

2.

Elija un producto número de clases

mc m

y un ancho de clase sea ligeramente mayor que el rango

c

de modo que el

m = raíz cuadrada de n = 50 m = 7 c = 10 mc = 70 Es mayor que el rango = 59 Estadística Básica

Procedimiento

3.

Elija un punto inicial, que debe ser algo menor que el puntaje bajo (min). Posteriormente se cuenta a partir de incrementos del ancho de clase. Cada denomina límites de clase.

más ahí en número obtenido se 35 ≤ x < 45 45 ≤ x < 55 55 ≤ x < 65 65 ≤ x < 75 75 ≤ x < 85 85 ≤ x < 95 95 ≤ x < 105

Estadística Básica

Procedimiento

4.

Una vez establecidas las clases, es necesario clasificar los datos en dichas clases. El método utilizado para realizar la clasificación depende del formato actual de los datos: si los datos están ordenados, es posible contar las frecuencias; si los datos no ordenados, se datos, es de utilidad usar un diagrama estándar.

están efectúa un conteo de éstos para determinar los números de frecuencia. Cuando se efectúa la clasificación de los

Número de clases

5 6 7 1 2 3 4

Límites

35 ≤ x < 45 45 ≤ x < 55 55 ≤ x < 65 65 ≤ x < 75 75 ≤ x < 85 85 ≤ x < 95 95 ≤ x < 105

Frecuencia

2 2 7 13 11 11 4 50

Estadística Básica

Notas

1. Si se han ordenado los datos (en forma de lista, de puntos o gráfica representación de tallo y hojas) el conteo es innecesario; simplemente se cuentan los datos que pertenecen a cada clase.

2. Si los datos no están ordenados, debe tenerse cuidado al efectuar el conteo.

3. La frecuencia

f

para cada clase es el que pertenecen a esa clase.

número de datos 4. La suma de frecuencias debe ser exactamente igual al número de datos

n (n = Σf).

Esta sumatoria es una verificación aceptable.

Estadística Básica

Notas

5.

Cada clase requiere un solo valor numérico para representar todos los valores de datos que caen en esa clase. La

marca de clase

(algunas veces denominada punto medio de clase) es el valor numérico que está exactamente a la mitad de ésta y se encuentra al sumar los límites de clase y dividirlo entre 2.

Número de clases

1 2 3 4 5 6 7

Límites

35 ≤ x < 45 45 ≤ x < 55 55 ≤ x < 65 65 ≤ x < 75 75 ≤ x < 85 85 ≤ x < 95 95 ≤ x < 105

Frecuencia

2 2 7 13 11 11 4 50

Marca de clase

40 50 60 70 80 90 100

Estadística Básica

Histograma

Gráfica de barras que representa una distribución de frecuencias de una variable cuantitativa. Un histograma está integrado por los siguientes componentes: 1. Un título, que identifica la población o la muestra de interés 2. Una escala vertical, que identifica las frecuencias que hay en las diversas clases 3. Una escala horizontal, que identifica la variable valores de los

x

. Los límites de una clase de las marcas de clase deben identificarse a lo largo del eje cualquier

x

. El empleo de método para identificar el eje presenta mejor a la variable.

Estadística Básica

Ejemplo

50 puntajes del examen final de estadística básica

14 12 10 8 6 4 2 0 40 50 60 70

Puntaje

80 90 100

Estadística Básica

Forma de los histogramas

Simétrico, normal o triangular Uniforme o rectangular Sesgado a la derecha Sesgado a la izquierda En forma de J Bimodal

Estadística Básica