Transcript 1 - silopema
Slide 1
ELEMENTOS DE
ESTADÍSTICA DESCRIPTIVA
Profr. Eliud Quintero Rodríguez
Slide 2
Introducción
La Estadística es una ciencia que
facilita la solución de problemas en
los cuales necesitamos conocer
características sobre el
comportamiento de algún suceso o
evento.
Nos permite inferir el
comportamiento de sucesos iguales o
similares sin necesidad de que estos
ocurran.
Slide 3
Esto nos da la posibilidad de tomar
decisiones acertadas y a tiempo,
así como realizar proyecciones del
comportamiento del suceso.
Sólo se realizan los cálculos y el
análisis con los datos obtenidos de
una muestra de la población y no
con toda la población.
Slide 4
Actualmente el DANE es el encargado de
concentrar y publicar la información estadística del
del país.
Slide 5
Conceptos básicos
Estadística:
Es la ciencia que se encarga de recolectar,
organizar, resumir y analizar datos para
después obtener conclusiones. Se divide en
Estadística Descriptiva y Estadística Inferencial.
Estadística descriptiva:
Se encarga de la recolección,
organización, presentación y
análisis de los datos de una
población.
Slide 6
Estadística inferencial:
Se encarga de analizar la información
presentada por la estadística descriptiva
mediante técnicas que nos ayuden a conocer,
con determinado grado de confianza, a la
población. Lo que nos permite tomar
decisiones.
Slide 7
Población:
Conjunto definido de TODOS los INDIVIDUOS, de
donde se observa cierta característica.
Al número de integrantes de la población se llama
tamaño de la población y se representa con la
letra N.
Las poblaciones pueden ser finitas o infinitas.
Slide 8
Población Estadística:
Conjunto de TODOS los DATOS que se obtienen al
realizar la medición de una variable en los
elementos de una población.
Muestra:
Subconjunto de una población, que intenta reflejar
las características de la población lo mejor posible.
El número de individuos que integran la muestra,
llamado tamaño de la muestra se representa con
la letra n.
Slide 9
Individuo:
Es el elemento de la población o de la muestra que
aporta información sobre lo que se estudia.
Variable:
Característica o propiedad de los individuos que se
desea estudiar y se puede medir o calificar;
cambia o varía con el tiempo en un individuo dado,
o cambia o varía de elemento a elemento.
Ej. Edad, peso, sexo, estado civil, número de hijos, etc.
Slide 10
Dato:
Valor que se obtiene al realizar la medición de la
característica de la variable en estudio.
Pueden ser univariados, bivariados o multivariados.
La naturaleza de los datos pueden ser datos
cuantitativos o datos cualitativos.
Slide 11
Datos Cuantitativos (números):
Valores obtenidos al medir peso,
estatura, temperatura, número
de hijos.
Datos Cualitativos (categorías):
Se obtienen al calificar la
característica en cuestión como
el sexo, estado civil, grado
máximo de estudios.
Slide 12
Variable Dicotómica:
Sólo puede tomar dos valores (sí – no, 0 – 1, hombre –
mujer, bueno – malo, encendido – apagado).
En la variable CUANTITATIVA se pueden distinguir
dos tipos: CONTINUA y DISCRETA.
Slide 13
Variable Continua:
Si la variable puede tomar cualquier
número real entre dos valores dados
(decimal o entero).
Ej. El peso de un individuo.
Variable Discreta:
Si la variable sólo puede tomar
números enteros.
Ej. El número de hijos de un individuo.
Slide 14
Escalas de Medición
Escala Nominal
Escala Ordinal
Escala de Intervalo
Escala de Razón
Slide 15
Escala Nominal:
Está asociada a variables cualitativitas y es
denominada de este modo si no se pueden hacer
operaciones aritméticas entre sus valores, pues éstos
son únicamente ETIQUETAS.
Ejemplo: sexo, código postal, estado civil, número
telefónico, número al correr en un maratón, deporte
favorito, carrera a estudiar, etc.
Slide 16
Escala Ordinal:
Los valores de la variable que tienen un ORDEN con
un nivel específico, pero no se pueden hacer
operaciones aritméticas entre ellas.
Ejemplo:
Pésimo – Malo – Regular – Bueno – Excelente
Primaria – Secundaria – Preparatoria - Licenciatura
Slide 17
Escala de Intervalo:
En ella existe un orden entre los valores de la
variable y además una NOCIÓN DE DISTANCIA
aunque no se puedan realizar operaciones.
El cero o punto de inicio no es único, es más bien un
punto de referencia.
Ejemplo: Escalas de temperatura, la edad de la
Tierra, la línea del tiempo de la humanidad.
Slide 18
Escala de Razón:
La magnitud tiene SENTIDO FÍSICO, existe el cero
absoluto, existe orden, se puede determinar
cuántas veces es mayor uno que otro.
Ejemplo: peso, estatura, edad, distancia, dinero, etc.
Slide 19
Fuentes de información
Encuesta:
Recopilar los datos mediante el uso
de cuestionarios o entrevistas.
Experimento:
Procedimiento utilizado en la
investigación científica para obtener
información que permita conocer el
comportamiento de algún proceso.
Slide 20
Fuentes de Información
Investigación Documental:
Procedimiento para obtener
datos mediante la consulta de
información ya escrita y
concentrada en documentos
que se localicen en libros o
revistas en bibliotecas,
hemerotecas, o en centros
virtuales.
Slide 21
Redondeo de datos, notación
científica y cifras significativas.
Redondeo:
El redondeo de datos es un
procedimiento que consiste en escribir un
número que representa a una cantidad
con menos cifras de las que tiene
realmente para tener una idea rápida de
la cantidad.
Slide 22
Orden de datos
La ordenación es el proceso mediante el cual los
datos están acomodados de tal manera que se
establece un orden (ascendente o descendente)
entre ellos.
Hay dos métodos comunes:
•
Listado en orden ascendente
• Método de tallo y hojas
Slide 23
Ejemplo
Considera que la variable de estudio es el peso de
25 estudiantes. Los pesos se encuentran en la
siguiente tabla:
Peso de 25 estudiantes (en kg)
40
56
52
63
57
43
44
62
50
66
48
42
44
56
63
51
55
50
55
51
49
52
59
45
58
Slide 24
Listado en orden ascendente
El proceso consiste en ordenarlos de menor a mayor
Peso de 25 estudiantes (en kg)
Peso de 25 estudiantes (en kg)
42
56
52
63
57
40
45
51
55
59
40
44
62
50
66
48
43
44
56
63
51
55
50
55
51
49
52
59
45
58
42
48
51
56
62
43
49
52
56
63
44
50
52
57
63
44
50
55
58
66
Slide 25
Método de tallo y hojas
Si los números de los datos están formados por
dos dígitos, se hace una columna con el primer
dígito (decenas) y a la derecha de cada uno
de ellos se escribe, en fila, sólo el segundo
dígito (unidades) de cada uno de los datos
que tengan el mismo primer dígito.
Slide 26
Datos sin ordenar:
2,0,8,9,4,3,4,5
1,6,5,2,2,0,9,0,6,5,7,1,8
2,3,6,3
4
5
6
Datos ordenados:
4
5
6
Peso de 25 estudiantes (en kg)
42
56
52
63
57
40
44
62
50
66
0,2,3,4,4,5,8,9
0,0,1,1,2,2,5,5,6,6,7,8,9
2,3,3,6
48
43
44
56
63
51
55
50
55
51
49
52
59
45
58
Slide 27
Doble tallo
Una variante de este método es en lugar de dividir
en un grupo las decenas, se divide en dos grupos. El
primero abarcando los dígitos del 0 al 4 y el
segundo del 5 al 9.
El ejemplo anterior
queda:
4
4
5
5
6
6
0,2,3,4,4
5,8,9
0,0,1,1,2,2,
5,5,6,6,7,8,9
2,3,3
6
Slide 28
Caso de variables cualitatitivas
El procedimiento es:
Se
identifican todos los valores diferentes y se
acomodan en columna.
Se
agrega una segunda columna en donde se van
registrando, mediante una línea vertical, la veces
que aparece el valor dado.
Slide 29
Ejemplo
Considera que la variable de estudio es el color de
playera de 25 estudiantes.
Los colores se encuentran en la siguiente tabla:
rosa
gris
azul
blanco
blanco
café
azul
negro
rosa
blanco
rosa
gris
gris
azul
azul
blanco
café
blanco
café
blanco
rosa
negro
blanco
gris
verde
Slide 30
Color
rosa
gris
azul
blanco azul
blanco café
negro
rosa
blanco
rosa
gris
gris
azul
café
blanco blanco
azul
blanco rosa
gris
blanco café
negro verde
Frecuencia
Azul
Blanco
Café
IIII
Gris
Negro
Rosa
Verde
IIII
II
IIII
I
IIII II
III
Slide 31
Tabla de Frecuencia de Datos
Una vez que se tenga ordenados los datos, se
acomodan en la “Tabla de distribución de
frecuencias o tabla de frecuencias”.
La tabla es básicamente una tabla de valores
x-y, dónde “x” representa el dato y “y”
representa la frecuencia.
Slide 32
La frecuencia es el número de veces que aparece
cada dato.
Hay dos clases de tablas de frecuencias:
Para
datos NO agrupados.
Para datos agrupados.
Slide 33
Tabla de frecuencias para
datos NO agrupados
Está formada por dos columnas: una para la
variable “xi” y la otra para su frecuencia “fi”, a
esta frecuencia se le llama frecuencia absoluta o
frecuencia observada.
La sumatoria de las frecuencias absolutas debe
coincidir con el numero de datos “n”.
Slide 34
Ejemplo
Tabla de frecuencias de los pesos en kg de 25
alumnos.
Peso de 25 estudiantes (en kg)
40
45
51
55
59
42
48
51
56
62
43
49
52
56
63
44
50
52
57
63
44
50
55
58
66
xi
fi
xi
fi
40
1
52
2
42
1
55
2
43
56
2
44
1
2
57
45
1
58
1
1
48
1
59
1
49
1
62
1
50
2
63
51
2
66
2
1
Total
25
Slide 35
Frecuencia relativa y acumulada
Por lo regular, se agregan dos columnas: la de la
frecuencia relativa “hi” y la de la frecuencia
acumulada “Fi”.
La frecuencia relativa se obtiene mediante el
cociente de la frecuencia y el número total de
datos, esto es hi = f/n.
La frecuencia acumulada se obtiene sumando las
frecuencias anteriores a las frecuencias de un dato
dado.
Slide 36
Ejemplo
1/25
xi
f
fr
xi
f
fr
fa
0.04
fa
1
40
1
52
2
0.08
14
42
1
0.04
2
55
2
43
1
3
56
2
16
18
44
2
0.04
0.08
0.08
0.08
5
57
1
0.04
45
1
0.04
6
58
1
0.04
19
20
48
1
0.04
59
1
0.04
21
49
1
0.04
7
8
62
1
0.04
22
50
2
10
63
2
51
2
0.08
0.08
12
66
1
0.08
0.04
24
25
Total
25
1
2/25
Siempre es 1
Siempre
es el
número
total
ELEMENTOS DE
ESTADÍSTICA DESCRIPTIVA
Profr. Eliud Quintero Rodríguez
Slide 2
Introducción
La Estadística es una ciencia que
facilita la solución de problemas en
los cuales necesitamos conocer
características sobre el
comportamiento de algún suceso o
evento.
Nos permite inferir el
comportamiento de sucesos iguales o
similares sin necesidad de que estos
ocurran.
Slide 3
Esto nos da la posibilidad de tomar
decisiones acertadas y a tiempo,
así como realizar proyecciones del
comportamiento del suceso.
Sólo se realizan los cálculos y el
análisis con los datos obtenidos de
una muestra de la población y no
con toda la población.
Slide 4
Actualmente el DANE es el encargado de
concentrar y publicar la información estadística del
del país.
Slide 5
Conceptos básicos
Estadística:
Es la ciencia que se encarga de recolectar,
organizar, resumir y analizar datos para
después obtener conclusiones. Se divide en
Estadística Descriptiva y Estadística Inferencial.
Estadística descriptiva:
Se encarga de la recolección,
organización, presentación y
análisis de los datos de una
población.
Slide 6
Estadística inferencial:
Se encarga de analizar la información
presentada por la estadística descriptiva
mediante técnicas que nos ayuden a conocer,
con determinado grado de confianza, a la
población. Lo que nos permite tomar
decisiones.
Slide 7
Población:
Conjunto definido de TODOS los INDIVIDUOS, de
donde se observa cierta característica.
Al número de integrantes de la población se llama
tamaño de la población y se representa con la
letra N.
Las poblaciones pueden ser finitas o infinitas.
Slide 8
Población Estadística:
Conjunto de TODOS los DATOS que se obtienen al
realizar la medición de una variable en los
elementos de una población.
Muestra:
Subconjunto de una población, que intenta reflejar
las características de la población lo mejor posible.
El número de individuos que integran la muestra,
llamado tamaño de la muestra se representa con
la letra n.
Slide 9
Individuo:
Es el elemento de la población o de la muestra que
aporta información sobre lo que se estudia.
Variable:
Característica o propiedad de los individuos que se
desea estudiar y se puede medir o calificar;
cambia o varía con el tiempo en un individuo dado,
o cambia o varía de elemento a elemento.
Ej. Edad, peso, sexo, estado civil, número de hijos, etc.
Slide 10
Dato:
Valor que se obtiene al realizar la medición de la
característica de la variable en estudio.
Pueden ser univariados, bivariados o multivariados.
La naturaleza de los datos pueden ser datos
cuantitativos o datos cualitativos.
Slide 11
Datos Cuantitativos (números):
Valores obtenidos al medir peso,
estatura, temperatura, número
de hijos.
Datos Cualitativos (categorías):
Se obtienen al calificar la
característica en cuestión como
el sexo, estado civil, grado
máximo de estudios.
Slide 12
Variable Dicotómica:
Sólo puede tomar dos valores (sí – no, 0 – 1, hombre –
mujer, bueno – malo, encendido – apagado).
En la variable CUANTITATIVA se pueden distinguir
dos tipos: CONTINUA y DISCRETA.
Slide 13
Variable Continua:
Si la variable puede tomar cualquier
número real entre dos valores dados
(decimal o entero).
Ej. El peso de un individuo.
Variable Discreta:
Si la variable sólo puede tomar
números enteros.
Ej. El número de hijos de un individuo.
Slide 14
Escalas de Medición
Escala Nominal
Escala Ordinal
Escala de Intervalo
Escala de Razón
Slide 15
Escala Nominal:
Está asociada a variables cualitativitas y es
denominada de este modo si no se pueden hacer
operaciones aritméticas entre sus valores, pues éstos
son únicamente ETIQUETAS.
Ejemplo: sexo, código postal, estado civil, número
telefónico, número al correr en un maratón, deporte
favorito, carrera a estudiar, etc.
Slide 16
Escala Ordinal:
Los valores de la variable que tienen un ORDEN con
un nivel específico, pero no se pueden hacer
operaciones aritméticas entre ellas.
Ejemplo:
Pésimo – Malo – Regular – Bueno – Excelente
Primaria – Secundaria – Preparatoria - Licenciatura
Slide 17
Escala de Intervalo:
En ella existe un orden entre los valores de la
variable y además una NOCIÓN DE DISTANCIA
aunque no se puedan realizar operaciones.
El cero o punto de inicio no es único, es más bien un
punto de referencia.
Ejemplo: Escalas de temperatura, la edad de la
Tierra, la línea del tiempo de la humanidad.
Slide 18
Escala de Razón:
La magnitud tiene SENTIDO FÍSICO, existe el cero
absoluto, existe orden, se puede determinar
cuántas veces es mayor uno que otro.
Ejemplo: peso, estatura, edad, distancia, dinero, etc.
Slide 19
Fuentes de información
Encuesta:
Recopilar los datos mediante el uso
de cuestionarios o entrevistas.
Experimento:
Procedimiento utilizado en la
investigación científica para obtener
información que permita conocer el
comportamiento de algún proceso.
Slide 20
Fuentes de Información
Investigación Documental:
Procedimiento para obtener
datos mediante la consulta de
información ya escrita y
concentrada en documentos
que se localicen en libros o
revistas en bibliotecas,
hemerotecas, o en centros
virtuales.
Slide 21
Redondeo de datos, notación
científica y cifras significativas.
Redondeo:
El redondeo de datos es un
procedimiento que consiste en escribir un
número que representa a una cantidad
con menos cifras de las que tiene
realmente para tener una idea rápida de
la cantidad.
Slide 22
Orden de datos
La ordenación es el proceso mediante el cual los
datos están acomodados de tal manera que se
establece un orden (ascendente o descendente)
entre ellos.
Hay dos métodos comunes:
•
Listado en orden ascendente
• Método de tallo y hojas
Slide 23
Ejemplo
Considera que la variable de estudio es el peso de
25 estudiantes. Los pesos se encuentran en la
siguiente tabla:
Peso de 25 estudiantes (en kg)
40
56
52
63
57
43
44
62
50
66
48
42
44
56
63
51
55
50
55
51
49
52
59
45
58
Slide 24
Listado en orden ascendente
El proceso consiste en ordenarlos de menor a mayor
Peso de 25 estudiantes (en kg)
Peso de 25 estudiantes (en kg)
42
56
52
63
57
40
45
51
55
59
40
44
62
50
66
48
43
44
56
63
51
55
50
55
51
49
52
59
45
58
42
48
51
56
62
43
49
52
56
63
44
50
52
57
63
44
50
55
58
66
Slide 25
Método de tallo y hojas
Si los números de los datos están formados por
dos dígitos, se hace una columna con el primer
dígito (decenas) y a la derecha de cada uno
de ellos se escribe, en fila, sólo el segundo
dígito (unidades) de cada uno de los datos
que tengan el mismo primer dígito.
Slide 26
Datos sin ordenar:
2,0,8,9,4,3,4,5
1,6,5,2,2,0,9,0,6,5,7,1,8
2,3,6,3
4
5
6
Datos ordenados:
4
5
6
Peso de 25 estudiantes (en kg)
42
56
52
63
57
40
44
62
50
66
0,2,3,4,4,5,8,9
0,0,1,1,2,2,5,5,6,6,7,8,9
2,3,3,6
48
43
44
56
63
51
55
50
55
51
49
52
59
45
58
Slide 27
Doble tallo
Una variante de este método es en lugar de dividir
en un grupo las decenas, se divide en dos grupos. El
primero abarcando los dígitos del 0 al 4 y el
segundo del 5 al 9.
El ejemplo anterior
queda:
4
4
5
5
6
6
0,2,3,4,4
5,8,9
0,0,1,1,2,2,
5,5,6,6,7,8,9
2,3,3
6
Slide 28
Caso de variables cualitatitivas
El procedimiento es:
Se
identifican todos los valores diferentes y se
acomodan en columna.
Se
agrega una segunda columna en donde se van
registrando, mediante una línea vertical, la veces
que aparece el valor dado.
Slide 29
Ejemplo
Considera que la variable de estudio es el color de
playera de 25 estudiantes.
Los colores se encuentran en la siguiente tabla:
rosa
gris
azul
blanco
blanco
café
azul
negro
rosa
blanco
rosa
gris
gris
azul
azul
blanco
café
blanco
café
blanco
rosa
negro
blanco
gris
verde
Slide 30
Color
rosa
gris
azul
blanco azul
blanco café
negro
rosa
blanco
rosa
gris
gris
azul
café
blanco blanco
azul
blanco rosa
gris
blanco café
negro verde
Frecuencia
Azul
Blanco
Café
IIII
Gris
Negro
Rosa
Verde
IIII
II
IIII
I
IIII II
III
Slide 31
Tabla de Frecuencia de Datos
Una vez que se tenga ordenados los datos, se
acomodan en la “Tabla de distribución de
frecuencias o tabla de frecuencias”.
La tabla es básicamente una tabla de valores
x-y, dónde “x” representa el dato y “y”
representa la frecuencia.
Slide 32
La frecuencia es el número de veces que aparece
cada dato.
Hay dos clases de tablas de frecuencias:
Para
datos NO agrupados.
Para datos agrupados.
Slide 33
Tabla de frecuencias para
datos NO agrupados
Está formada por dos columnas: una para la
variable “xi” y la otra para su frecuencia “fi”, a
esta frecuencia se le llama frecuencia absoluta o
frecuencia observada.
La sumatoria de las frecuencias absolutas debe
coincidir con el numero de datos “n”.
Slide 34
Ejemplo
Tabla de frecuencias de los pesos en kg de 25
alumnos.
Peso de 25 estudiantes (en kg)
40
45
51
55
59
42
48
51
56
62
43
49
52
56
63
44
50
52
57
63
44
50
55
58
66
xi
fi
xi
fi
40
1
52
2
42
1
55
2
43
56
2
44
1
2
57
45
1
58
1
1
48
1
59
1
49
1
62
1
50
2
63
51
2
66
2
1
Total
25
Slide 35
Frecuencia relativa y acumulada
Por lo regular, se agregan dos columnas: la de la
frecuencia relativa “hi” y la de la frecuencia
acumulada “Fi”.
La frecuencia relativa se obtiene mediante el
cociente de la frecuencia y el número total de
datos, esto es hi = f/n.
La frecuencia acumulada se obtiene sumando las
frecuencias anteriores a las frecuencias de un dato
dado.
Slide 36
Ejemplo
1/25
xi
f
fr
xi
f
fr
fa
0.04
fa
1
40
1
52
2
0.08
14
42
1
0.04
2
55
2
43
1
3
56
2
16
18
44
2
0.04
0.08
0.08
0.08
5
57
1
0.04
45
1
0.04
6
58
1
0.04
19
20
48
1
0.04
59
1
0.04
21
49
1
0.04
7
8
62
1
0.04
22
50
2
10
63
2
51
2
0.08
0.08
12
66
1
0.08
0.04
24
25
Total
25
1
2/25
Siempre es 1
Siempre
es el
número
total