Apuntes de apoyo de *Estadística Descriptiva*

Download Report

Transcript Apuntes de apoyo de *Estadística Descriptiva*

Apuntes de apoyo de
“Estadística Descriptiva”
Martínez Stone Claudia Montserrat
Origen de la Estadística
En su origen, la estadística surge como
una disciplina enfocada a conocer los
recursos del Estado mediante su
cuantificación, de ahí su nombre.
Posteriormente con la diversificación
de sus aplicaciones, se dio por llamar
estadísticas a las tablas en las que se
codifica la información,
extendiéndose este nombre a la
disciplina en general de recopilar,
ordenar, analizar e interpretar
información cuantitativa.
Definiciones de Estadística
Noreau de Jonneis (1847).- "La
Estadística es la ciencia de los
hechos sociales, expresados en
términos numéricos".
Romelín
(1863).-"La
Estadística
describe las características de la
sociedad
humana
a
base
de
observaciones metodológicas y de
enumeraciones
de
fenómenos
similares".
Definiciones de Estadística
Arthur Bowley (1901).- "La Estadística
es la ciencia de los promedios, la
ciencia de los grandes números".
Mason y Lind (1998).- “Ciencia que trata
de la recopilación, organización,
presentación, análisis e interpretación
de datos numéricos (Estadísticas) con
el fin de realizar una toma de
decisiones más efectiva”
Método Estadístico
• Identificación y definición del
problema.
• Formulación de objetivos e
hipótesis.
• Recopilación de la información.
• Organización y aplicación de las
herramientas estadísticas.
• Análisis e interpretación.
• Conclusiones.
• Toma de decisiones.
Descriptiva, estudia poblaciones totales que
describe a través de medidas que la resumen
llamadas parámetros:
•Medidas de tendencia central
•Medidas de Posición
•Medidas de dispersión
•Asimetría
•Kurtosis
Inferencial, estudia una muestra de la
población que analiza exhaustivamente, y a
partir de ella infiere lo que sucede en la
población a través de los estimadores de los
parámetros (estadísticos) que la describen:
•Probabilidad
•Muestreo
•Estimación
•Pruebas de Hipótesis
Población, se
refiere a una
totalidad, es decir,
al conjunto de
todos los
elementos que la
conforman, o, a
todos los valores
que puede tomar la
variable en estudio
Muestra, parte
representativa
de la población,
o un
subconjunto de
ella
VARIABLE
Elemento de interés que puede tomar
valores diferentes.
Cuantitativa; es
aquella cuyos
valores se
pueden expresar
como cantidades
numéricas
Cualitativa; solo puede
clasificarse pero no
medirse, no proporciona
información
cuantificable, se refiere
solamente a las
características de la
variable
Discretas, solo pueden asumir ciertos
valores que se caracterizan por ser
enteros, finitos y positivos
VARIABLES
CUANTITATIVAS
Continuas, pueden asumir cualquier valor
dentro de un cierto intervalo,
caracterizándose porque pueden ser
decimales e infinitas
EJEMPLOS DE VARIABLES
CONTINUAS
Precio de una acción
en una muestra de
varios días.
Peso de cajas de fruta
empacadas para su
exportación.
Velocidad de un
automóvil en ciertos
tramos de una
carretera.
El tiempo de duración
de 5,000 lámparas
incandescentes.
DISCRETAS
Número de autos
vendidos en un mes
por una agencia.
Número de cuadernos
utilizados al semestre
por un estudiante.
Número de puntos
anotados en un juego
de baloncesto.
Número de personas
que asisten cada
semana a los servicios
religiosos de cierto
templo.
SERIES DE TIEMPO:
Aquellas cuya información
muestra un orden cronológico o
una evolución temporal de la
variable.
VARIABLES
CUANTITATIVAS
SERIES DE CORTE TRANSVERSAL:
Aquellas cuya información se toma en un
mismo momento del tiempo entre diferentes
miembros de una población o lugares.
SERIE ESTADÍSTICA
Conjunto de datos ordenados que miden los
cambios en una variable, ya sea de manera
cronológica o transversal
SERIE
SIMPLE
SERIE DE
FRECUENCIAS
SERIE DE CLASES Y
FRECUENCIAS O DE
DATOS AGRUPADOS
Serie Simple
Como su nombre lo indica, es la más
sencilla, y se define como:
“Conjunto de datos ordenados
de manera ascendente o
descendente, que miden las
variaciones de un fenómeno
o variable”
Serie o Distribución de Frecuencias
“CONJUNTO DE DATOS ORDENADOS QUE
MIDEN LOS CAMBIOS EN UN
FENÓMENO O VARIABLE,
RELACIONÁNDOLOS O PONDERÁNDOLOS
CON SU FRECUENCIA”
Frecuencia, es el número de veces que un término o
valor que adopta una variable se repite o existe en una
serie estadística; se representa como y ó f.
SERIE DE CLASES Y FRECUENCIAS
“CONJUNTO DE DATOS ORDENADOS,
AGRUPADOS EN SUBCONJUNTOS QUE
MIDEN LOS CAMBIOS DEL FENÓMENO
O VARIABLE Y RELACIONÁNDOLOS CON
SU FRECUENCIA”
Clase, es un subconjunto de algunas observaciones de la variable, cercanos unos a
otros, de acuerdo con sus características.
Intervalo de clases, es el rango de valores encontrados dentro de una clase.
Intervalo de Clase
1. Buscamos el valor más pequeño o el
primer valor en una serie ordenada
previamente (frontera inferior) y el
valor más grande (frontera superior).
2. Calculamos el rango o recorrido de la
serie (Rango = F. Sup. – F. Inf.).
3. Dividimos el rango entre el número de
clases que se desea tener.
Rango
Intervalo de clase =
Número de clases que se desean
EJEMPLO:
Los siguientes datos se refieren a la
duración en horas de 40 focos tomados
por el departamento de control de
calidad de su fábrica.
54
83
66
78
78
66
73
90
96
83
62
78
78
73
90
83
96
66
83
73
73
78
54
78
90
73
83
73
78
62
66
83
73
73
96
78
107
73
66
62
Serie Simple
n
1
2
3
4
5
6
7
8
9
10
xi
54
54
62
62
62
66
66
66
66
66
n
11
12
13
14
15
16
17
18
19
20
xi
73
73
73
73
73
73
73
73
73
78
n
21
22
23
24
25
26
27
28
29
30
xi
78
78
78
78
78
78
78
83
83
83
n
31
32
33
34
35
36
37
38
39
40
xi
83
83
83
90
90
90
96
96
96
107
SERIE O DISTRIBUCIÓN DE FRECUENCIAS
xi
54
62
66
73
78
83
90
96
107
SUMA
y
2
3
5
9
8
6
3
3
1
40
yac
2
5
10
19
27
33
36
39
40
yrel.
2/40=0.050
3/40=0.075
5/40=0.125
9/40=0.225
8/40=0.200
6/40=0.150
3/40=0.075
3/40=0.075
1/40=0.025
40/40=1.00
%
5.0
7.5
12.5
22.5
20.0
15.0
7.5
7.5
2.5
100.0
Serie de clases y Frecuencias
n  40  6.3246 redondeam so  6 clases
Rango F .S .  F .I .  107  54  53
clases  6
Intervalo de clase 
Rango
Núm ero de clases que se desean
53
  8.83
6
Serie de Clases y Frecuencias
xi
De 54 a 62.82
De 62.83 a 71.66
De 71.67 a 80.49
De 80.50 a 89.32
De 89.33 a 98.16
De 98.17 a107.00
y
5
5
17
6
6
1
40
Ejercicios de Aplicación
•
1.- Elaboración de ejercicios que impliquen la representación en Series de los datos:
– a.1. Los siguientes, son los números de videocámaras producidas durante 50
turnos de 8 horas seleccionadas al azar.
348
410
384
385
366
354
371
374
368
399
392
395
360
377
380
400
375
338
369
335
349
359
379
390
376
356
358
329
389
333
397
322
343
370
390
368
344
432
398
386
361
399
376
358
341
374
362
347
396
351
– a.2. Un Banco, esta estudiando el número de veces que es utilizado por día un
cajero automático localizado en un supermercado. A continuación se indica los
números de veces que el aparato se empleo en los últimos 30 días
83 64 84 76 84 54 75 59 70 61
63 80 84 73 68 52 65 90 52 77
95 36 78 61 59 84 95 47 87 60
Representación Gráfica
• Nos permite observar
rápidamente el comportamiento
de la serie estadística.
• Histograma
• Polígono de frecuencias
• Ojiva
• Gráfica por sectores
• Gráfica de Pareto
Histograma
DURACION DE FOCOS
100
50
DATO
40
37
34
31
28
25
22
19
16
13
10
7
4
0
1
HORAS
150
Histograma de
Frecuencias
y FRECUENCIA
DURACION DE FOCOS
10
5
0
54
62
66
73
78
83
Xi HORAS
90
96
107
Histograma de Frecuencias
FRECUENCIA
DURACION DE FOCOS
20
15
10
5
0
58.41
67.25
76.08 84.91 93.75 102.59
PUNTO MEDIO Xi
Polígono de Frecuencias
DURACION DE FOCOS
FRECUENCIAS
10
8
6
4
2
0
54
62
66
73
78
HORAS
83
90
96
107
Ojiva
FRECUENCIA
ACUMULADA
DURACION DE FOCOS
50
40
30
20
10
0
54
62
66
73
78
HORAS
83
90
96
107
Gráfica de Sectores
DURACION DE FOCOS
96
8%
90
8%
107
3%
54
5%
62
8%
66
13%
83
14%
73
22%
78
19%
INFORMACIÓN CUALITATIVA
Se representa gráficamente
por:
• Histogramas
• Gráficas de Pareto
• Gráficas de Sectores
Histograma
ENCUESTA DE CALIDAD
MALA
SUFICIENTE
REGULAR
BUENA
EXCELENTE
0
5
10
15
Gráfica de pareto
AL
A
M
EX
CE
LE
NT
E
RE
GU
LA
R
SU
FI
CI
EN
TE
16
14
12
10
8
6
4
2
0
BU
EN
A
FRECUENCIA
ENCUESTA DE CALIDAD
Gráfica de Sectores
ENCUESTA DE CALIDAD
MALA
7%
SUFICIENTE
15%
EXCELENTE
24%
REGULAR
20%
BUENA
34%
DATOS BIVARIADOS
Se obtienen cuando se miden dos
variables en una sola unidad
experimental.
Cuando se miden más de dos
variables se denominan
multivariados.
Representación gráfica:
 Gráficas de barras
 Gráficas de línea
 Gráficas de área
Gráfica de Barras
800
600
COSTOS
400
INGRESOS
200
0
1995 1996 1997 1998 1999 2000
Gráfica de Líneas
PESOS
800
600
400
200
0
1995
1996
1997
1998
1999
AÑO
COSTOS
INGRESOS
2000
Gráfica de Barras
PESOS
1500
1000
500
0
1995
1996
1997
1998
1999
AÑO
COSTOS
INGRESOS
2000
GRÁFICA DE BARRAS
100%
80%
60%
40%
20%
0%
1995
1996
1997
1998
1999
AÑO
COSTOS
INGRESOS
2000
Gráfica de Áreas
800
600
400
200
0
1995
1996
1997
1998
AÑO
INGRESOS
COSTOS
1999
2000
Ejercicios de Aplicación
•
1.- Leer en la Antología el Tema de Representación Gráfica para conocer los diferentes tipos de
gráficas que existen.
•
2.- Del siguiente ejercicios (Anexo en material) Graficar la información y presentarla, mediante:
–
Histograma
–
–
Polígono
Gráfica de Sectores
Ejemplo 1: Precios de
Automóviles
20,197
20,372
17,454
20,591
24,453
14,266
15,021
25,683
27,872
16,587
20,169
32,851
16,281
21,285
21,324
21,609
25,670
12,546
12,935
16,873
22,251
22,277
21,533
24,443
16,889
17,004
14,357
17,155
16,688
20,657
23,613
17,203
20,765
22,783
23,661
29,277
17,642
18,981
21,052
22,799
15,263
33,625
14,399
14,968
17,356
18,442
18,722
16,331
19,817
17,633
17,962
19,845
23,285
24,896
26,076
29,492
15,890
18,740
21,571
22,449
25,337
17,642
20,613
21,220
27,655
19,442
14,891
23,237
17,445
18,556
18,639
21,296
Medidas de Tendencia Central
Las medidas de tendencia
central se usan para buscar
el valor central de la serie o
distribución estadística. Son:
la media,
la mediana y
la moda.
Media
• Es el valor central, teórico y
exacto que representa el centro
de una serie estadística.
Puede ser:
– Aritmética
– Geométrica
– Armónica
Propiedades de la Media
•
•
•
Todo conjunto de datos de nivel de
intervalo y de nivel de razón tiene una
media.
Al evaluar la media se incluyen todos los
valores.
La media es única para un conjunto de
valores dado.
Propiedades de la Media
•
Es muy útil para comparar dos o más
poblaciones.
•
Es la única medida de tendencia central
en donde la suma de las desviaciones de
los valores individuales respecto de la
media es igual a cero.
Media Aritmética
Es un número tal que si sumamos
tantas veces como términos tenga la
serie estadística, su suma no se
altera.
• Es lo que se conoce como promedio
simple, se calcula:
n
x
 xi
i 1
n
MEDIA ARITMÉTICA
Sea la sucesión cuyos términos son:
x1, x2, x3 ...… xn.
Designando con x a la media aritmética
obtenemos:
x + x + x + x + x + x = x1+ x2 + x3 +...+ xn
Por lo tanto: para una serie simple:
nx = x1+ x2 + x3 +...+ xn
Despejando la x queda la fórmula:
n
x
 xi
i 1
n
MEDIA ARITMÉTICA
EJEMPLO SERIE SIMPLE
Duración de 40 focos ...
n
1
2
3
4
5
6
7
8
9
10
xi
54
54
62
62
62
66
66
66
66
66
n
11
12
13
14
15
16
17
18
19
20
xi
73
73
73
73
73
73
73
73
73
78
n
21
22
23
24
25
26
27
28
29
30
n
31
32
33
34
35
36
37
38
39
40
n
n = 40
xi = 3,068
xi
78
78
78
78
78
78
78
83
83
83
x
 xi
i 1
n
3,068

 76.7
40
xi
83
83
83
90
90
90
96
96
96
107
MEDIA ARITMÉTICA
SERIE DE FRECUENCIAS
Las frecuencias nos
indican cuántas
veces se repiten
los datos, por lo
que la suma de Y,
nos indica el total
de datos.
n
 xiy
x
y
i 1
MEDIA ARITMÉTICA
EJEMPLO SERIE DE FRECUENCIAS
Duración de 40 focos ...
xi
y
xiy
54
2
108
62
3
186
66
5
330
73
9
657
78
8
624
83
6
498
90
3
270
96
3
288
107
1
107

40
3,068
y = 40
xiy = 3,068
n
 xiy 3,068
x

 76.7
 y 40
i 1
MEDIA ARITMÉTICA
SERIE DE CLASES Y FRECUENCIAS
•Dado que ahora la variable
agrupa a un subconjunto de
valores (datos), es
necesario, representarla con
la marca de clase xim.
•Marca de clase, valor
representativo de los datos
que se agrupan en la clase,
se calcula con la media
aritmética de los límites de
cada clase.
FÓRMULAS
L. inf .  L. sup .
xim 
2
n
 xim y
x
y
i 1
MEDIA ARITMÉTICA
EJEMPLO SERIE DE
CLASES Y FRECUENCIAS
Duración de 40 focos ...
xi
De 54 a 62.82
De 62.83 a 71.66
De 71.67 a 80.49
De 80.50 a 89.32
De 89.33 a 98.16
De 98.17 a 107

y
5
5
17
6
6
1
40
xim
58.41
67.25
76.08
84.91
93.75
102.59
n
y = 40
ximy = 3,096.15
ximy
292.05
336.23
1,293.36
509.46
562.47
102.59
3,096.16
 xim y 3,096.16
x

 77.40
40
y
i 1
Ejercicios Media
•
1.- Evalúe la media de la siguiente población de valores: 6 3 5 7 6
•
2.-Determinar el salario medio por hora pagado a carpinteros que obtuvieron los siguientes pagos
por hora:
$15.40, $20.10, $18.75, $22.76, $20.67, $18.00
•
3.- La Compañía de Servicio eléctrico, seleccionó 20 clientes residenciales al azar. Los siguientes, son
los importes (en dlls) que se cargaron a los clientes por el servicio eléctrico en el último mes:
54, 48, 58, 60, 25, 47, 75, 46, 60, 70, 67, 68, 39, 35, 56, 66, 33, 62, 33, 62, 65, 67
•
4.- Determinar la media de la siguiente distribución de frecuencias
Clase
Frecuencia
0.01 a 5
2
5.01 a 10
7
10.01 a 15
12
15.01 a 20
6
20.01 a 25
3
MEDIANA
Valor central que divide una serie estadística
en dos partes exactamente iguales.
Es un valor real central exacto.
Es también una medida de posición.
Para calcular la mediana, necesitamos primero ubicar el
lugar en dónde se encuentra, ya que esta demás es una
medida de posición, lo cual se logra determinando su
número de orden:
Serie simple
n 1
# orden Md 
2
Serie de frecuencias y de clases
y frecuencias
# orden
y 1

Md 
2
MEDIANA
Duración de 40 focos ...
n  1 40  1
# orden Md 

 20.5  21
2
2
xi
y
yac
54
62
66
73
2
3
5
9
78
8
27
83
90
96
107
SUMA
6
3
3
1
40
33
36
39
40
2
5
10
19
Md = 78
MEDIANA
SERIE DE CLASES Y FRECUENCIAS
y
Md  Li 
2
 Yac
Fi
(i )
Donde:
Md.=Mediana
Li = Límite inferior de la clase que contiene a la mediana;
y = Número de términos ó suma de las frecuencias
yac = Frecuencia acumulada de la clase anterior a la que
contiene la mediana.
Fi = Frecuencia de la clase que tiene a la mediana.
i = Amplitud del intervalo de la clase que contiene la Md.
MEDIANA
SERIE DE CLASES Y FRECUENCIAS
Duración de 40 focos ...
Clase
mediana
yac
xi
y
De 54 a 62.82
De 62.83 a 71.66
5
5
10
De 71.67 a 80.49
17
27
De 80.50 a 89.32
6
33
De 89.33 a 98.16
6
De 98.17 a 107
1
40
39
40

# orden
y
5
y  1 40  1

Md 

 20.5  21
2
2
40
 yac
 10

Md  Li  2
(i )  71.67  2
8.83  76.86
Fi
17
Ejercicios Mediana
•
1.- Una muestra de personas solteras, que recibe pagos por seguro social, revelo los siguientes ingresos mensuales:
$426, $299, $290, $687, $480, $439, y $565
– ¿Cual es la mediana de los ingresos?
– ¿Cuántas observaciones están por debajo de la mediana? ¿cuántas por arriba?
•
2.- El número de paros laborales en la industria automotriz para meses seleccionados son: 6, 0, 10, 14, 8 y 0
– ¿Cuál es la mediana del número de paros?
– ¿Cuántas observaciones están por debajo de la mediana? ¿Cuántas por arriba?
– ¿Cuál es el valor modal de los paros en el trabajo?
•
3- El contador en jefe de una empresa, quiere preparar un informe acerca de las cuentas pro cobrar de la compañía. A
continuación, se presenta una distribución de frecuencias que muestra la cantidad sobresaliente
Cantidad
Frecuencia
$ 0 a $2000
4
$2000 a $4000
15
$4000 a $6000
18
$6000 a $8000
10
$8000 a $10,000
4
$10,000 a $12,000
3
MODA
• Es el valor de máxima frecuencia.
• Es el término que más aparece o se
repite en una distribución.
• En la serie simple y la distribución de
frecuencias, no existe fórmula para
determinarla, sino que se obtiene
mediante la observación de la
frecuencia más alta o del término que
más veces se repite.
MODA
En el caso de la serie de clases y frecuencias
se utiliza una fórmula de interpolación:
donde:
d1
Mo.  Li 
(i)
d1  d 2
Li = Límite inferior de la clase que contiene a Mo.
d1= ym - y1
d2= ym - y2
ym= frecuencia de la clase que contiene a Mo.
y1= frecuencia de la clase anterior que contiene a la Mo.
y2= frecuencia de la clase posterior que contiene a la Mo.
i= Amplitud del intervalo.
MODA
Duración de 40 focos ...
Clase
modal
xi
de 54 a 62.82
de 62.83 a 71.66
de 71.67 a 80.49
de 80.50 a 89.32
de 89.33 a 98.16
de 98.17 a 107
SUMA
y
5
5
17
6
6
1
40
yac
5
10
27
33
39
40
d
12
1

Mo.  Li 
(i )  71.67 
8.83  76.28
d d
12  11
1 2
Ejercicio Moda
•
Actualmente hay alrededor de 1.2 millones de hombres y mujeres en el activo
del Ejército, la Marina, la Infantería de Marina y la Fuerza Aérea de Estados
Unidos. A continuación se muestra una clasificación porcentual de las edades.
¿Cuál es la moda?
Edad (años)
De 15 a menos de 20 años
De 20 a menos de 25 años
De 25 a menos de 30 años
De 30 a menos de 35 años
De 35 a menos de 40 años
De 40 a menos de 45 años
De 45 a menos de 50 años
Frecuencia
15
33
19
7
11
4
1
MEDIDAS DE DISPERSIÓN
•
Nos indican la variabilidad que
tienen los datos de la serie
estadística respecto de una medida
de
tendencia
central,
que
generalmente es la media. Son:
 Rango
 Desviación media
 Desviación estándar
RANGO O RECORRIDO
Es la medida de dispersión más sencilla,
y nos indica el campo de variación del
Rango, definida como la diferencia
entre el mayor y el menor de los valores
observados.
Esta medida, no refleja en modo alguno
la forma de la distribución.
Rango= Valor Max. – Valor Min.
DESVIACIÓN MEDIA
Se define como la suma de las
desviaciones en términos absolutos de
los datos que integran la serie, respecto
a la media, entre el número de términos
de la serie.
Serie simple
xi  x

D.M . 
n
Serie de frecuencias
xi  x

D.M . 
y
y
Desviación Media
Serie de Frecuencias
Xi
54
62
66
73
78
83
90
96
107
SUMA
y
2
3
5
9
8
6
3
3
1
40
(Xi-Xm)
-22.7
-14.7
-10.7
-3.7
1.3
6.3
13.3
19.3
30.3
IXi-Xm I
22.7
14.7
10.7
3.7
1.3
6.3
13.3
19.3
30.3
IXi-Xm Iy
45.4
44.1
53.5
33.3
10.4
37.8
39.9
57.9
30.3
352.6
Xi  X y 352.6

D.M . 

 8.815
40
y
Desviación Media
Serie de clases y Frecuencias
Xi
Xim
De 54.00 a 62.82 58.41
De 62.83 a 71.66 67.25
De 71.67 a 80.49 76.08
De 80.50 a 89.32 84.91
De 89.33 a 98.16 93.75
De 98.17 a107.00 102.59
SUMA
y
5
5
17
6
6
1
40
(Xim-Xm)
-19.00
-10.16
-1.33
7.50
16.34
25.18
IXim-Xm I IXim-Xm Iy
19.00
94.98
10.16
50.78
1.33
22.53
7.50
45.03
16.34
98.07
25.18
25.18
336.56
Xim  X y 336.56

D.M . 

 8.414
40
y
DESVIACIÓN MEDIA
RELATIVA
• SERIE DE
FRECUENCIAS
DM
DMR 
100
X
8.815
DMR 
100
76.7
DMR  11.49%
• SERIE DE
CLASES Y
FRECUENCIAS
DM
DMR 
100
X
8.414
DMR 
100
77.41
DMR  10.87%
DESVIACIÓN ESTÁNDAR ()
• La desviación estándar, es la raíz
cuadrada positiva del promedio de las
desviaciones al cuadrado de los
valores observados, respecto a la
media aritmética;
• Indica el grado de dispersión que
tienen los términos de la serie con
respecto a su media aritmética.
DESVIACIÓN ESTÁNDAR ()
2
(
Xi

X
)



n
2
((
Xi

X
)
y)


y
Serie de frecuencias

 (( xim  X )
y
2
Serie simple
y)
Serie de clases y
frecuencias
COEFICIENTE DE VARIACIÓN
• Se define como la razón porcentual
entre la desviación estándar y la
media aritmética:
C .V . 

X
* 100
DESVIACIÓN ESTÁNDAR ()
SERIE DE FRECUENCIAS
Xi
54
62
66
73
78
83
90
96
107
SUMA
y
2
3
5
9
8
6
3
3
1
40
(Xi-Xm)
-22.7
-14.7
-10.7
-3.7
1.3
6.3
13.3
19.3
30.3
(Xi-Xm)^2
515.29
216.09
114.49
13.69
1.69
39.69
176.89
372.49
918.09
(Xi-Xm)^2y
1030.58
648.27
572.45
123.21
13.52
238.14
530.67
1117.47
918.09
5,192.40
2
y
(
Xi

X
)
5,192.4



 11.39
40
y
DESVIACIÓN ESTÁNDAR ()
SERIE DE CLASES Y FRECUENCIAS
Xi
Xim
De 54.00 a 62.82 58.41
De 62.83 a 71.66 67.25
De 71.67 a 80.49 76.08
De 80.50 a 89.32 84.91
De 89.33 a 98.16 93.75
De 98.17 a107.00 102.59
SUMA
y
5
5
17
6
6
1
40
(Xim-Xm) (Xim-Xm)^2 (Xim-Xm)^2y
-19.00
360.82
1,804.10
-10.16
103.13
515.65
-1.33
1.76
29.86
7.50
56.32
337.93
16.34
267.15
1,602.91
25.18
634.27
634.27
4,924.70
2
y
(
xim

X
)
4,924.7



 11.10
40
y
Coeficiente de Variación
• SERIE DE
FRECUENCIAS
CV 

100
X
11.39
CV 
100
76.7
CV  14.85%
• SERIE DE
CLASES Y
FRECUENCIAS
CV 

100
X
11.10
CV 
 100
77.41
CV  14.33%
REGLA EMPÍRICA:
• Para
una
distribución
de
frecuencias
simétrica
de
campana, cerca de 68% de las
observaciones estará dentro de
±1σ de la mediaX (µ); cerca de
95%
de
las
observaciones
estará dentro de ±2σ de la
media (µ); alrededor de 99.7%
estará dentro de ±3σ de la
media (µ).
Curva en forma de campana
que muestra la relación entre  y 
3
2
1

1
2
3
Teorema de Chebyshev
• Para cualquier conjunto de
observaciones, la proporción
mínima de valores que está
dentro
de
k
desviaciones
estándar desde la media es al
menos 1 - 1/k , donde k2 es una
constante mayor que 1.
Ejercicios Dispersión
•
1. El reporte anual de la empresa “A”, dio los siguientes rendimientos de capital para los accionistas, en un periodo de 5 años
pasados: 13.2, 5.0, 10.2, 17.5 y 12.9.
a) Calcular la amplitud de variación, la media aritmética, la desviación media y la desviación estándar
•
2. La Empresa “B”, reportó los siguientes rendimientos del capital para los accionistas, para cinco años pasados: 4.3, 4.9, 7.2, 6.7
y 11.6.
– a) Calcular la amplitud de variación, la media aritmética, la desviación media y la desviación estándar.
– b) Comparar los rendimientos de la empresa “B” con los de la empresa “A” del ejercicio anterior
•
3. A cada persona que se presenta como aspirante a un trabajo de ensamble en una empresa mueblera, se le aplica un examen
de aptitudes mecánicas. Una parte de la prueba consiste en ensamblar un armario basándose en instrucciones numeradas. En
la siguiente distribución de frecuencias se tiene una muestra de los tiempos que necesitaron 42 personas para ensamblar un
armario.
Tiempo
(En minutos)
2a4
4a6
6a8
8 a 10
10 a 12
12 a 14
Número
4
8
14
9
9
2
ASIMETRÍA
• Nos indica la
• Se puede determinar tendencia o sesgo de
comparando las
la serie estadística.
medidas de
tendencia central.
• Se puede medir
mediante los
“Coeficientes de
Pearson” o el
“Método de
momentos”.
• Indica la
desproporcionalidad
entre los valores
distribuidos
alrededor de la
media ya sea que
tiendan a los valores
más pequeños, a los
más grandes, o si se
distribuyen
proporcionalmente.
ASIMETRÍA
SESGO CERO
Moda = Mediana = Media
ASIMETRÍA POSITIVA
Sesgo a la derecha:
Mo<Md<Xm
ASIMETRÍA NEGATIVA
Sesgo a la izquierda:
Xm<Md<Mo
ASIMETRIA
COEFICIENTES DE PEARSON
•Nos dan una medida relativa del sesgo.
3 X  Md 
A1 


X  Mo
A2 

Criterios de
clasificación
A = 0 Simetría
A > 0 Asimetría
positiva
A < 0 Asimetría
negativa
ASIMETRIA
COEFICIENTES DE PEARSON
(Serie de frecuencias)
A1 
3 X  Md 

A1  Asim etría
A2
376.7  78

 0.3424
11.39
Negativa

X  Mo 76.7  73


 0.3248

A2  Asim etría
11.39
Positiva
ASIMETRIA
COEFICIENTES DE PEARSON
(Serie de clases y frecuencias)
3 X  Md  377.47  76.86
A1 

 0.1649

11.10
A1  Asim etría
A2
Positiva

X  Mo 77.47  76.28


 0.1072

A2  Asim etría
11.10
Positiva
ASIMETRIA
MÉTODO DE MOMENTOS
Se mide en el
tercer
momento.
M 
3
 x i
 x
n
Corresponde
al
Serie de
M3
promedio frecuencias
de las
desviacion
es
elevadas al
3
cubo.


xim

x
y

M3 
y
3

Serie
simple
 x i
 x y
y
3
Serie de
clases y
frecuencias
ASIMETRIA
MÉTODO DE MOMENTOS
Coeficiente de
Asimetría
M3
A 3

Criterios de
clasificación
A = 0 Simetría
A > 0 Asimetría
positiva
A < 0 Asimetría
negativa
Asimetría
(Serie de Frecuencias)
Xi
54
62
66
73
78
83
90
96
107
SUMA
y
2
3
5
9
8
6
3
3
1
40
(Xi-Xm)
-22.7
-14.7
-10.7
-3.7
1.3
6.3
13.3
19.3
30.3
(Xi-Xm)^3
-11,697.08
-3,176.52
-1,225.04
-50.65
2.20
250.05
2,352.64
7,189.06
27,818.13
(Xi-Xm)^3y
-23,394.17
-9,529.57
-6,125.22
-455.88
17.58
1,500.28
7,057.91
21,567.17
27,818.13
18,456.24
Asimetría
18,456.24
461.41
M 
 461.41; A 
 0.3123
11.39
40
Positiva
3
3
Asimetría
(Serie de Clases y Frecuencias)
Xi
Xim
De 54.00 a 62.82 58.41
De 62.83 a 71.66 67.25
De 71.67 a 80.49 76.08
De 80.50 a 89.32 84.91
De 89.33 a 98.16 93.75
De 98.17 a107.00 102.59
SUMA
y
5
5
17
6
6
1
40
5,163.76
M3 
 129.09;
40
(Xim-Xm) (Xim-Xm)^3 (Xim-Xm)^3y
-19.00
-6,853.86
-34,269.29
-10.16
-1,047.30
-5,236.51
-1.33
-2.33
-39.57
7.50
422.68
2,536.06
16.34
4,366.51
26,199.08
25.18
15,973.97
15,973.97
5,163.76
129.09
A
 0.0944
3
11.10
Asimetría Positiva
KURTOSIS
Indica la desproporcionalidad horizontal
entre los valores distribuidos alrededor
de la media ya sea que tiendan a
concentrarse alrededor de la media, a
estar dispersos, o si se distribuyen
equitativamente alrededor de la media.
Se clasifican en:
 Leptokúrticas,
 Mesokúrticas y
 Platikúrticas
LEPTOKURTICA
Curvas
apuntadas
con alta
concentración
µ
MESOKURTICA
µ
Curvas de apuntamiento medio
consideradas normales
PLATIKURTICA
µ
Curvas
dispersas y aplanadas
KURTOSIS
Leptokúrtica
Mesokúrtica
Platikúrtica
µ
KURTOSIS
Se mide en el
cuarto
momento.
M4
 Xi  X 


n
M4
  Xim  X 
4
y
Serie
simple
 Xi  X 


y
4
Corresponde al
Serie de
promedio de las
frecuencias
desviaciones
elevadas a la
cuarta
potencia.
M4 
4
y
Serie de
clases y
frecuencias
y
Coeficiente de Kurtosis
CRITERIOS DE
CLASIFICACIÓN
M4
K  4 3

• K=0 Mesokúrtica
• K>0 Leptokúrtica
• K<0 Platikúrtica
KURTOSIS
(Serie de frecuencias)
Xi
54
62
66
73
78
83
90
96
107
SUMA
y
2
3
5
9
8
6
3
3
1
40
(Xi-Xm) (Xi-Xm)^4 (Xi-Xm)^4y
-22.7 265,523.78 531,047.57
-14.7
46,694.89 140,084.66
-10.7
13,107.96 65,539.80
-3.7
187.42
1,686.74
1.3
2.86
22.85
6.3
1,575.30
9,451.78
13.3
31,290.07 93,870.22
19.3
138,748.80 416,246.40
30.3
842,889.25 842,889.25
2,100,839.27
52,520.98
A
 3  0.1206
2,100 ,839 .27
4
M4 
 52,520 .98
11.39
40
Curva Leptokurtica
KURTOSIS
(Serie de clases y frecuencias)
Xi
Xim
De 54.00 a 62.82 58.41
De 62.83 a 71.66 67.25
De 71.67 a 80.49 76.08
De 80.50 a 89.32 84.91
De 89.33 a 98.16 93.75
De 98.17 a107.00 102.59
SUMA
y
5
5
17
6
6
1
40
(Xim-Xm) (Xim-Xm)^4 (Xim-Xm)^4y
-19.00
130,190.73
650,953.64
-10.16
10,635.61
53,178.06
-1.33
3.08
52.44
7.50
3,172.09
19,032.51
16.34
71,369.58
428,217.47
25.18
402,300.50
402,300.50
1,553,734.62
1,553,734 .62
M4 
 38,843 .37
40
A
38,843.37
 3  0.4413
4
11.10
Curva Platikurtica
Ejercicios de aplicación
•
Caso 1
Una Compañía de plomería, que fue fundada hace 40 años ha crecido hasta más de 500
empleados actualmente. Se esta considerando el asunto de varios puestos dentro de la
compañía donde tiene a hombres y mujeres desarrollando el mismo trabajo pero recibiendo
una retribución diferente. Para investigar, recolecto la siguiente información. Suponga que
usted tiene la tarea de escribir un informe resumiendo la situación.
Sueldo Anual
(Miles de dólares)
20 a 30
30 a 40
40 a 50
50 a 60
60 a 70
70 a 80
80 a 90
Mujeres
2
3
17
17
8
3
0
Hombres
0
1
4
24
21
7
3
Se debe calcular varias medidas de ubicación, elaborar gráficas, determinar los cuartiles para
hombres y mujeres. Realizar gráficas y escribir el informe resumiendo los sueldos anuales.
¿Existe diferencia en lo que respecta al género?
•
Caso 2
En una reunión de ventas de una compañía, se le preguntó al ejecutivo en jefe cuál era la política de la
compañía acerca de las comisiones pagadas a sus representantes de ventas. La empresa vende artículos
deportivos a dos mercados importantes. Hay 40 representantes de ventas que tratan directamente con
clientes grandes y 30 personas de ventas que se dedican al menudeo.
Se solicito la elaboración de un informe, comparando las comisiones ganadas el año pasado por las dos
partes del equipo de ventas. La información se presenta a continuación. ¿Existe diferencia? Asegúrese de
incluir información en el informe respecto a la dispersión y tendencia central en los dos grupos.
Comisiones ganadas por los representantes de ventas con clientes grandes
354
87
1676
1187
63
3202
680
1106
883
3140
299
2197
175
434
615
149
1168
278
579
252
1602
2321
4
392
416
526
13
1604
249
557
635
Comisiones ganadas por los representantes de ventas al menudeo
1116
681
1294
12
754
1206
1255
1213
1219
719
934
850
886
1556
886
1315
1066
807
1244
758
918
1448
1313
1858
39
159
7
427
527
1687
1105
357
1738
870
1083
1262
944
899
1338
Probabilidad
• Mide la posibilidad de ocurrencia de
algún fenómeno o variable, basándose en
la observación de sus eventos anteriores.
• La teoría de probabilidades tiene su origen
en los juegos de azar, al tomar su
mecánica.
• Se refiere a los posibles resultados de un
experimento o evento que forman el
conjunto universo, pero no conocemos lo
que sucederá con certeza hasta que
ocurre.
Experimento; forma
de observación directa
en la que se conocen
los factores que influyen
en su resultado, se
basa en la experiencia.
Aleatorio; que
tiene que ver
con el azar.
Experimento Aleatorio; Es el que tiene resultados
inciertos, pero que se conocen sus probabilidades;
es cualquier evento que resulte en uno y solo uno
de varios resultados bien definidos, pero que no
permite anticipar cuál prevalecerá en un caso
particular.
Evento (Resultado Básico):
Cualquiera de los resultados
posibles de un experimento
aleatorio, cuyo suceso gobierna
todos los resultados
alternativos.
Espacio Muestral;
contiene todos los posibles resultados de
un experimento aleatorio, se representa
por S (U ó Ω), se conoce también como
Conjunto Universo en el que cada
elemento es un punto muestral o evento.
S  1,2,3,4,5,6
Variable Aleatoria
Discreta; Sus valores
se interrumpen
o separan, es finita
Variable Aleatoria
Continua; Sus valores
posibles no se
interrumpen, es
infinita
• Variable Aleatoria;
Función real valorada
definida en el espacio
de muestra. Se da
cuando se conoce su
espacio muestral en
forma total y
exhaustiva, y se
conoce además la
probabilidad de
ocurrencia de cada
punto contenido en el
espacio muestral
Matemática o teórica
Como frecuencia relativa
Teoría Clásica de la
Probabilidad
Teoría Estadística o
Subjetiva de la Probabilidad
Teoría Axiomática de la
probabilidad
PROBABILIDAD MATEMÁTICA O
TEÓRICA
Es aquella en la que podemos contar
exactamente todas las formas diferentes
en las que un evento puede o no
suceder, y que además podemos
suponer que todas las formas posibles
ocurrirán sobre bases igualmente
probables
PROBABILIDAD COMO FRECUENCIA
RELATIVA
Si contamos el numero de veces en que se
presenta un evento en un numero n de
experimentos aleatorios, determinamos su
“frecuencia absoluta” que simbolizamos con f.
En tanto que el cociente f/n, que establece la razón
entre la frecuencia de ocurrencia del evento y el
total de experimentos se le denomina
“frecuencia relativa”
EJEMPLO
Lanzamos 20 veces un dado y anotamos
sus resultados:
Resultado
1
2
3
4
5
6
Suma
Frecuencia
Absoluta
2
3
4
5
3
3
20
Frecuencia Relativa o
Probabilidad
2/20 = 0.10
3/20 = 0.15
4/20 = 0.20
5/20 = 0.25
3/20 = 0.15
3/20 = 0.15
20/20 = 1
TEORÍA CLÁSICA DE LA PROBABILIDAD
Si un experimento da lugar a n eventos
mutuamente excluyentes e igualmente
probables, en los que r se consideran
éxitos, entonces, la probabilidad de tener
un evento exitoso es:
P=r/n
TEORÍA ESTADÍSTICA O
SUBJETIVA DE LA
PROBABILIDAD
Se basa en la experiencia sobre lo
sucedido anteriormente en situaciones
similares. Se obtiene de datos
estadísticos registrados de experiencias o
experimentos; también se compone de
apreciaciones subjetivas
TEORÍA AXIOMÁTICA DE LA
PROBABILIDAD
1 ) 0  P( A )  1
2 ) P( S )  1
3 ) P(  )  0
4 ) P( Ac )  1  P( A )
REGLA DE ADICIÓN
Especial
P AB   P A  PB 
Cuando A y B son mutuamente
excluyentes y colectivamente exhaustivos
General
P AB   P A  PB   P AB 
REGLA DE MULTIPLICACIÓN
Especial
P AB   P A  PB 
Cuando A y B son eventos independientes
General
P AB   P A  PB / A ; y A>0
P AB   PB   P A/ B  ; y B>0
Principio de
independencia
PROBABILIDAD CONDICIONAL
P(B|A) = Probabilidad de B dado A
“Es la probabilidad de ocurrencia
de B dependiendo de la
ocurrencia de A”
(Principio de independencia)
PRINCIPIO DE INDEPENDENCIA
Regla:
Sea un evento cualquiera del espacio
muestral S, con P(x) > 0.
La probabilidad de que ocurra un evento B
cuando A ya ha ocurrido, se le llama
probabilidad condicional o principio de
independencia.
P( A  B)
P( B / A) 
P( A)
Ejercicios Probabilidad
1.- Una tienda de departamentos, vende camisas deportivas en 3 tallas, (pequeña, mediana y grande), en
tres modelos (a cuadros, estampada y de franjas) y con dos largos de manga (corta y larga)
Manga Corta
Talla
Pequeña
Mediana
Grande
Total
Cuadros
4
9
3
16
Modelo
Estampada
3
8
7
18
Franjas
5
12
9
26
Total
12
29
19
60
Cuadros
3
10
4
17
Modelo
Estampada
2
5
2
9
Franjas
3
8
8
19
Total
8
23
14
45
Manga Larga
Talla
Pequeña
Mediana
Grande
Total
•
•
•
•
•
•
¿Cuál es la probabilidad de que la camisa vendida sea mediana de manga larga y estampada?
¿Cuál es la probabilidad de que la camisa vendida sea mediana y estampada?
¿Cuál es la probabilidad de que la camisa vendida sea de manga corta?
¿Cuál es la probabilidad de que la camisa vendida sea de franjas o pequeña?
Dado que la camisa recién vendida era de cuadros y mediana. ¿Cuál es la probabilidad de que sea de
manga corta?
Dado que la camisa recién vendida era de cuadros y manga corta ¿Cuál es la probabilidad de que su talla
sea mediana?
TEOREMA DE BAYES
Se refiere a la probabilidad condicional; se usa
para reformular un conjunto de probabilidades “a
priori”; para un conjunto de probabilidades “a
posteriori”.
Su reformulación se basa en información adicional
que se puede obtener de registros pasados o
muestras
𝑷 𝑨𝒊 𝑩𝟏 =
𝑷 𝑨𝟏 𝑷 𝑩𝟏 𝑨𝟏
𝑷 𝑨𝒊 𝑷(𝑩𝟏 |𝑨𝒊 )
+ 𝑷 𝑨𝟐 𝑷 𝑩𝟏 𝑨𝟐 … … … … . +𝑷 𝑨𝒊 𝑷(𝑩𝟏 |𝑨𝒊 )
Ejercicios de Probabilidad
1.- En un programa de capacitación para el personal del área administrativa en la empresa
Claremont Enterprises, 80% de los capacitados son mujeres, y 20% varones. El 90% de las
mujeres asistió a una universidad, y 78% de los varones también.
Una persona del programa se selecciona al azar. ¿cuál es la probabilidad de que un empleado
seleccionado sea una mujer dado que no asistió a una universidad?
2.- Una moneda se lanza al aire cuatro veces
¿Cuál es la probabilidad de que en cada tirada salga una cara?
3.- La Probabilidad de que un avión de en el blanco, en una operación de bombardeo, es de
0.80. Si se envían cuatro bombardeos hacia el mismo objetivo, ¿Cuál es la probabilidad de que
todos los aviones acierten en el blanco?
4.- El comisario de la policía, clasifica como delitos por edad (en años) del malhechor, y su el crimen es con violencia o no.
Según se muestra a continuación, al comisario se le informo de un total de 150 delitos cometidos durante el pasado año.
Edad (en años)
–
–
–
–
–
Tipo de delito
Menos de
20
40
40 o mas
Total
Con violencia
27
41
14
82
Sin violencia
12
34
22
68
Total
39
75
36
150
¿Cuál es la probabilidad de seleccionar un caso para analizarlo y encontrar que se trato de un delito con violencia?
¿Cuál es la probabilidad de seleccionar un caso para analizarlo y descubrir que el delito lo cometió alguien con menos de
40 años de edad?
¿Cuál es la probabilidad de seleccionar un caso relacionado con un crimen violento o un delincuente de menos de 20
años de edad?
Dado que se selecciona para el análisis un delito con violencia, ¿Cuál es la probabilidad de que lo haya cometido una
persona de menos de 20 años de edad?
Un Juez selecciono dos casos para revisarlos ¿Cuál es la probabilidad de que ambos sean crímenes cometidos con
violencia?
5.- Una persona que vive en Los Ángeles, realiza viajes frecuentes de consultoría a Washington, D.C., 50% de las veces viaja en
la aerolínea 1, 30% en la aerolínea 2 y 20% en la aerolínea 3. Para la aerolínea 1, los vuelos llegan con un retraso a Washington
D.C., el 30% de las veces, para la aerolínea 2, 25% de las ocasiones tienen retraso y en la aerolínea 3, 40% de las veces.
– ¿Cuál es la probabilidad de que en un viaje cualquiera, el vuelo haya llegado retrasado a Washington
y este haya sido por la aerolínea 3?
DISTRIBUCIÓN DE
PROBABILIDAD
“Conjunto de probabilidades asociadas a la
frecuencia con que ocurre cada elemento de
la variable aleatoria”
Asociación entre el valor que toma la variable
aleatoria y su probabilidad de ocurrencia.
Espacio Muestral Discreto
“Es un espacio de muestra que contiene
un número finito o numerable infinito de
puntos muestrales o eventos.”
Como el valor de un evento numérico varia al
repetir el muestreo, a este tipo de eventos
se les conoce como variable aleatoria.
Una variable es una función de los puntos
muestrales en S.
Distribuciones de Probabilidad:
P(x)
 Se ubica en el cuadrante
(++) del plano cartesiano
Discreta
 Es entera, finita y positiva
Nace en el origen y termina
en n donde corta el eje de las
abscisas y completa el
S=1
área bajo la curva
0
1
X
 Su área bajo la curva es
igual a 1
Distribuciones de Probabilidad:
 Se localiza en los
cuadrantes (+,+) y (+,-) del
plano cartesiano
Contínua
P(x)
 No es finita y puede ser
decimal.
S1
-∞
 Nace en - ∞ y va hasta ∞,
nunca corta el eje de las x
∞
X
 Su área bajo la curva
tiende a 1
Distribuciones de Probabilidad
Discretas
ESPERANZA MATEMÁTICA
Es la media probabilística, y se refiere al valor
medio que se espera que ocurra.
Es el valor esperado que divide en el centro en 2
partes iguales a una distribución de probabilidades.
E( x )     X i P xi 
Distribuciones de Probabilidad
Discretas
ESPERANZA MATEMÁTICA, CARACTERISTICAS:
E(X), se define como:
E(X) =  x f(x)
Donde  es la suma sobre todos los valores de X y f(x) es
la distribución de probabilidad de X
PROPIEDADES:
1. El valor esperado de una constante es la constante misma.
Así, si b es una constante, E(b) = b.
2. Si a y b son constantes E(aX + b) = aE(X) + b
Distribuciones de Probabilidad
Discretas
ESPERANZA MATEMÁTICA, PROPIEDADES:
3. Si x y Y son variables aleatorias independientes:
E(XY) = E(X) E(Y)
Es decir, la esperanza del producto XY es el producto de las esperanzas
individuales de X y Y.
4. Si X es una variable aleatoria con FDP f(x) y si g(X) es cualquier función de X,
entonces
E g(X) =  g(X) f(x)
Por tanto, si g(X) = X2
E(X2 ) =  X2 f(X)
Distribuciones de Probabilidad
Discretas
VARIANZA
Es la media del
cuadrado de las
desviaciones de las
mediciones respecto
de su media, mide la
variabilidad promedio
de la Distribución de
probabilidad:

V x   E  xi   
2

    xi    P x 
2
2
 
  E xi  
2
2
2
Distribuciones de Probabilidad
Discretas
Momentos superiores:
El tercer y cuarto momentos de una
distribución se utilizan a menudo para
estudiar la “forma” de una distribución de
probabilidad, en particular, su asimetría, A
(es decir, falta de simetría) y su
apuntamiento o curtosis C (es decir, que
tan alta o que tan plana es la distribución).
Distribuciones de Probabilidad
Discretas
Tercer momento:
M3=E(X-μ)3, mide la asimetría de una
distribución de probabilidades, en un
variable aleatoria discreta
M    xi    P x 
3
3
Distribuciones de Probabilidad
Discretas
Tercer momento:
A
M3

3
Coeficiente de asimetría
Para las funciones simétricas, A =0,
Para las distribuciones asimétricas, esta
medida será positiva si la cola larga está en
dirección positiva o hacia los valores mayores y
viceversa;
Si A > 0, habrá asimetría positiva;
Si A < 0, habrá asimetría negativa.
Distribuciones de Probabilidad
Discretas
Cuarto momento:
M4=E(X-μ)4, mide la concentración respecto
de la esperanza matemática, en una
variable aleatoria discreta.
M    xi    P x 
4
4
Distribuciones de Probabilidad
Discretas
C
M4

4
Cuarto momento:
3
Coeficiente de curtosis
Mide el espesor en las colas de la distribución en
el que mide su exceso de curtosis;
estadísticamente su valor para una curva
normal es 3, por lo que:
C=3 ó C-3 = 0 curva mesocúrtica
C>3 ó C-3 > 0 curva leptocúrtica
C<3 ó C-3 < 0 curva platicúrtica
METODOS DE CONTEO Y COMBINATORIOS
Sirven para conocer los arreglos de posibles objetos en
uno o varios conjuntos, los principales son permutaciones
y combinaciones.
Permutaciones: Arreglo de todos o parte de los eventos
del conjunto en un orden definido; se utiliza principalmente
cuando queremos formar muestras de eventos aleatorios en
un muestreo sin reemplazo, en el que una parte importante
del experimento se refiere al orden en el que son elegidos
los elementos de la muestra o en que ocurren los diferentes
eventos.
n!
n Pr 
n  r !
Combinaciones: Arreglo de todos o parte de los
eventos de un conjunto sin considerar su orden,
solo se consideran los elementos que contienen.
Se utiliza principalmente cuando realizamos
muestreo sin reemplazo en el que no es
importante el orden en el que se obtienen los
elementos de la muestra, sino los que forman
parte de ella.
n!
nCr 
r ! n  r !
Distribución Binomial de
Probabilidades
Es la distribución de probabilidad de los
posibles resultados de un experimento
aleatoria repetido “n” veces en ocasiones
sucesivas, en el cual los resultados son
independientes entre sí y mutuamente
excluyentes, es decir, no puede ocurrir más
de uno en cada intento.
Características de un Experimento
Binomial:
 El experimento consta de n pruebas idénticas
 Cada prueba tiene solo 2 resultados posibles p (éxito) y q
(fracaso). Variables dicotómicas
 La probabilidad de tener éxito en una sola prueba es igual a p
y permanece constante de prueba a prueba.
 La probabilidad del fracaso es q = (1 – p).
 Todas las pruebas son independientes
 La variable aleatoria bajo estudio es x, el número de éxitos
observados en n pruebas
P( x )
 n  n x
x
   q
p
 x

 
Dónde:
n = Número total de elementos (muestra o
intentos repetidos)
x = Número de éxitos que se busca
p = Probabilidad de éxito
q = Probabilidad de fracaso
Propiedades de la Distribución
Binomial
2 = Var = npq
  npq
138
µ = E(x) = np
Ejercicios Distribuciones Discretas
1.- Un 10% de los empleados de producción de una empresa, están ausentes del trabajo en
un determinado día de verano. Supóngase que se seleccionan al azar 10 trabajadores de
producción para un estudio riguroso de ausentismo.
– ¿Cuál es la probabilidad de que ninguno de los 10 empleados seleccionados esta
ausente?
– ¿Cuál es la probabilidad de que menos de 3 estén ausentes?
– ¿Cuál es la probabilidad de que al menos 3 estén ausentes?
2.- Se asegura que el 95% del correo de primera clase, se entrega dentro de la misma
ciudad, a los dos días de haber hecho el envío. Se mandan aleatoriamente seis cartas a
diferentes sitios.
–
–
–
–
a) ¿Cuál es la probabilidad de que las seis cartas lleguen a su destino dentro de los dos
días?
b) ¿Cuál es la probabilidad de que exactamente 5 lleguen dentro de dos días?
c) ¿Cuál es la probabilidad de que menos de 2 cartas lleguen dentro de dos días?
d) Determinar la media y la desviación estándar de las cartas que llegan en el periodo
Distribución de Poisson
x
Es la distribución de una variable discreta
que puede presentar todos los valores
enteros no negativos; donde X es el
número de ocurrencias de algún evento
en el tiempo o espacio.
P( x ) 
 e
x

x!
Nos indica la probabilidad de que ocurran x
eventos en un intervalo dado de tiempo y
espacio.
PROPIEDADES:
Donde:
x = variable aleatoria
discreta
= np
e = 2.718281
= 
2 = 
 
Distribución de Poisson
Condiciones de Aplicación:
1.- Que la ocurrencia o no ocurrencia de un evento en
un intervalo de tiempo o espacio dado, sea
independiente de su ocurrencia o no en otros
intervalos de tiempo o espacio.
2.- Que la amplitud del intervalo de tiempo o espacio
se pueda elegir lo suficientemente pequeña para que
la probabilidad de que ocurran 2 ó más eventos
dentro de un mismo intervalo sea prácticamente nula.
Distribución de Poisson
Condiciones de Aplicación:
3.- Que incrementando o disminuyendo la amplitud
del intervalo de tiempo o espacio en una magnitud fija
y finita, el intervalo aumente o disminuya
proporcionalmente a la probabilidad de ocurrencia del
evento dado.
4.- Que al aumentar o disminuir en forma continua el
intervalo de tiempo o espacio por valores
infinitesimales, aumente o disminuya la probabilidad
del evento dado en forma continua.
Distribución
Hipergeométrica
Arreglo sistemático asociado a dos resultados, éxito o
fracaso en un proceso caracterizado por la reducción
del espacio de muestra y el cambio correspondiente en
las probabilidades de intento a intento.
La principal aplicación de la distribución de
probabilidad hipergeométrica se presenta al extraer
muestras sin reemplazo de un universo finito.
Combinaciones de Éxito posibles
Combinaciones de Fracaso posibles
 N 1  N  N 1 

 x 

 n x 





Px 
N

 n

Muestras


posibles tamaño
n
Donde:
N = Población
N1= Subconjunto de N, elementos con la
característica que denota éxito
n = Tamaño de la muestra
x = Variable, (número de éxitos en la muestra)
Distribución Hipergeométrica
Propiedades:
N1
  np ; donde p  N

2
 
 N n
 npq 

 N 1
N n
npq
N 1
;


 ; donde

N n
N 1
N1
p
N
Factor de Corrección
El factor de corrección es una aproximación al
100%, para aproximar el cálculo a la realidad.
Distribución Hipergeométrica
Ejercicio:
Se sabe que, en un hospital con 52 enfermos, 19 requieren ser
intervenidos quirúrgicamente. Si se toma una muestra al azar de 10
personas, ¿Cuál es la probabilidad de que 2 requieran cirugía?
Donde:
N = 52 enfermos es la Población
N1= 19 requiriendo cirugía Subconjunto de N, elementos con la característica que
denota éxito (por ser lo que se pregunta)
n = 10 Tamaño de la muestra
x = 2 Variable, (número de éxitos en la muestra)
 N1  N  N1 

 x 

 nx 




 
Px  
N

 n



1 9 5 2  1 9

 2 

 10 2 




  1711 3,884,156  0.1501
P ( x  2) 
(1 5,820,024,220)
 5 2


1 0


Ejercicios Distribuciones Discretas
3.- Una fábrica de láminas de vidrio, produce 50 láminas cada hora, y 10 errores
distribuidos al azar durante el día. Si la producción es de 12 horas por día. ¿Cuál es
la probabilidad de encontrar en 1 lámina menos de 2 errores?
4.- En promedio, el 0.25% de la producción de un mes de partes de automóvil son
defectuosas. ¿Cual es la probabilidad de que al elegir una remesa, esta contenga
más de 3 partes defectuosas?
5.- Un pedido de vinos es de 10 cajas, cada caja contiene 12 botellas, en cada caja 1
botella es de reserva especial. Si se toma una muestra al azar de 6 botellas, ¿cual
es la probabilidad de que menos de 2 sean de reserva especial?
6.- En un salón de clases con 35 alumnos, el 30% tienen 10 años cumplidos. Si
tomamos una muestra al azar de 5 alumnos, ¿Cuál es la probabilidad de que al
menos 2 no tengan 10 años cumplidos?
Función de Densidad de Probabilidad Continua
DISTRIBUCIÓN NORMAL
Es una distribución simétrica cuyo recorrido es ilimitado ya que es una
distribución continua.
Su área bajo la curva está dada por:

F x   
f  x dx

S1
-
0

f(x) = Función de densidad
de probabilidad
x = Variable de integración
DISTRIBUCIÓN NORMAL
ESTANDARIZADA
Sus propiedades en términos probabilísticos son:
 = 0;  = 1
 
Donde:
Z = Área bajo la curva
 = Media poblacional
 = Desviación estándar
X = Valor individual
N = Población
X 

Características de la
Curva Normal
 Es simétrica y tiene forma de campana, su recorrido es ilimitado.
 La media divide al área bajo la curva en exactamente 2 partes
iguales (X = Mo = Md)
 Es una distribución continua de probabilidad por lo que su número
de eventos puede ser infinito.
 El cálculo de la probabilidad de ocurrencia de un evento, se mide
con el tamaño del área que representa el evento bajo la curva
normal. (Tabla normal Z estandarizada)
Distribución Normal
Ejercicio
El promedio de ingresos anuales de un profesionista
especializado en determinada empresa es de 34,000 dlls, con
una desviación estándar de 2,000 dlls.
S1
-
0
µ

Distribución Normal
Ejercicio
a) ¿Cuál es el porcentaje de las personas que ganan más de
35,000 dlls?
S1
X 


.5
.5


35,000 34,000

2000
Z  0.5
Z
-
0
µ=34,000 x= 35000
X= 35,000
µ= 34,000
σ= 2,000
Se busca el valor de Z en tablas* es igual a
0.1915
Por buscar el valor más de a 0.5, que es la
mitad del área bajo la curva, se le resta el
valor de Z en tablas es decir:
0.5 - 0.1915 = 0.3085
Es decir, el 30.85% de las personas ganan
más de 35,000 dlls.
* Ver siguiente lamina con explicación de tabla. Archivo anexo de Word, tabla Normal
Se busca 0.5,
• En la 1er columna Z se
busca la unidad y la
Primera décima
• y en el 1er renglón, se
busca el segundo
decimal.
La Tabla de Distribución
Normal Z Estandarizada, es
simétrica, por lo que al
obtener un número
negativo, se buscará igual,
es decir, en términos
absolutos.
(Esta tabla está en el
Archivo de Word, anexo)
Distribución Normal
Ejercicio
b) ¿Cuál es la probabilidad de elegir una persona, que gane
X 
entre 33,500 y 35,000 dlls?


.5
-
.5

33,000 34,000
Z1 

2000
Z1  0.5
35,000 34,000
Z2 

2000
Z 2  0.5
0 x1=33,000 µ=34,000 x2= 35000
Z1
Z1= ?
X1= 33,000
µ= 34,000
σ= 2,000
Z2
Z2= ?
X2= 35,000
µ= 34,000
σ= 2,000
Se busca el valor de Z en tablas es igual a 0.1915
Por buscar el valor de -0.5 y 0.5 es el mismo valor
por ser simétrica el área bajo la curva.
Se suman ambos valores de la tabla Z1 y Z2:
0.1915 + 0.1915 = 0.3830
Es decir, el 38.30% de las personas ganan entre
33,000 y 35,000 dlls.
Distribución Normal
Ejercicio
c) ¿Qué porcentaje de las personas ganan entre 34,500 y 35,600
dlls?
X 

.5
-
0
.5
µ x1=34,500 x2= 35,600
Z1
Z2
Z1= ?
X1= 35,600
µ= 34,000
σ= 2,000
Z2= ?
X2= 34,500
µ= 34,000
σ= 2,000


35,600 34,000
Z1 

2000
Z1  0.80
34,500 34,000
Z2 

2000
Z 2  0.25
Se busca el valor de Z en tablas es igual a:
Z1 = 0.80 = 0.2881 en tablas y
Z2 = 0.25 = 0.0987 en tablas
El valor Z va de la media al punto que se busca es
decir X
A Z1 se le restara el valor de Z2:
0.2881 – 0.0987 = 0.1894
Es decir, el 18.94% de las personas ganan entre
34,500 y 35,600 dlls.
Distribución Normal
Ejercicio
d) ¿En qué intervalo de ingresos se encuentra el 96% de los
profesionistas?
X 


X    Z 

.5
.5
X  34,000 2.06(2000)
.48
-
0
x1
X 1  34,000 4,120  29,880
.48
µ
X 2  34,000 4,120  38,120
x2
96%
Z= 2.06
X1= ?
µ= 34,000
σ= 2,000
Z= 2.06
X2= ?
µ= 34,000
σ= 2,000
Ahora se conoce el valor de Z.
96%, que se divide entre 2 y se busca .4800
dentro de tablas, el valor exacto o el primero que
se pase.
Las coordenadas es el valor de Z ±2.06 por ser
simétrica.
Se calcula X1 y X2
El intervalo del 96% estará entre
38,120 y 29,880
•Se busca 96% ÷2= 0.48
dentro de la tabla
• Se elige el número entero
ó el primero que se pase.
• Se buscan las
coordenadas.
La Tabla de Distribución
Normal Z estandarizada, es
simétrica, por lo que el valor de
las coordenadas, multiplicado
por σ, se sumara y restará a la
media.
Esta tabla está en el Archivo de Word,
anexo .
Ejercicios Distribución Normal
1.- El tiempo promedio que recorre una persona para llegar de su casa al trabajo es de 24
min con una desviación estándar de 3.8 min.
– a) ¿Cuál es la probabilidad de que llegue en al menos 32 min?
– b) Si la oficina la abren a las 9:00 am y sale de su casa a las 8:45am, ¿Qué porcentaje
de las veces no llega a tiempo a su trabajo?
– c) Si sale a las 8:35am de su casa, y el café lo sirven de 8:50am a 9:00am, ¿Qué
porcentaje de las veces se pierde el café?
– d) ¿El 75% de las ocasiones, en que intervalo de tiempo llega?
2.- El promedio de ingresos anuales de un profesionista especializado en determinada
empresa es de 34,000 dlls, con una desviación estándar de 2,000 dlls.
– a) ¿Cuál es el porcentaje de las personas que ganan más de 35,000 dlls?
– b) ¿Cuál es la probabilidad de elegir una persona, que gane entre 33,500 y 35,500
dlls?
– c) ¿Qué porcentaje de las personas ganan entre 34,500 y 35,600 dlls?
– d) ¿En qué intervalo de ingresos se encuentra el 96% de los profesionistas?
Ejercicios Distribución Normal
3.- Una máquina expendedora de refrescos, rellena vasos de 200ml con una
desviación estándar de 5ml.
–
–
–
–
a) ¿Cuál es el porcentaje de los vasos que se rellenan con menos de 190ml?
b) ¿En una remesa de 1000 vasos de 230ml, cuántos se derraman?
c) ¿Cuál es la probabilidad de que se rellenen entre 195 y 210ml?
d) ¿En qué intervalo de mililitros se rellena el 95% de los vasos?
4.- El peso promedio de ratas de laboratorio, utilizadas para experimentos, es de
189grs, con una desviación estándar de 5.7grs.
–
–
–
–
a) ¿Qué porcentaje de los animales pesan más de 200grs?
b) ¿Qué porcentaje pesan entre 195 y 205 grs?
c) ¿Qué porcentaje pesan al menos 175grs?
d) ¿En qué intervalo de pesos se encuentra el 95% de los animales?
Apéndice D Áreas debajo de la curva normal
Ejemplo: Si z = 1.96, entonces p(0 a z) = 0.4750.
(Lind, Douglas A.. Estadistica Aplicada a Los Negocios y a la Economia, 12th Edition.
McGraw-Hill Interamericana, 022006. 21.9).