Clase_NBA_13

Download Report

Transcript Clase_NBA_13

Medidas de Posición u Orden
Análisis de Datos I
Semestre Otoño 2009
Los Puntajes Z y los Percentiles son ejemplos
de medidas que se usan para comparar valores
en función de su posición relativa respecto al
resto de los datos ordenados de su distribución
Las Puntuaciones Z se usan para comparar
valores dentro de distintos conjuntos de datos
Los Percentiles se ocupan para representar
valores dentro del mismo conjunto de datos
1. Puntuaciones Z
Una puntuación Z o puntuación estándar se calcula
convirtiendo un valor a una escala estandarizada
La Puntuación estándar o Puntuación Z corresponde
a:
“Número de desviaciones estándar que un valor x se
encuentra por arriba o por debajo de la media”
Se calcula con la siguiente fórmula:
xx
z
s
Ejemplo:
Comparación de estatura
La superestrella de la NBA Michael Jordan mide
198cm, en tanto que una famosa mujer
basketbolista Rebecca Lobo mide 1,95.
En efecto Michael es más alto por 3 cm pero
¿Cuál de los dos jugadores es relativamente
más alto?
Dicho de otra forma:
¿La estatura de Michael Jordan, entre los
hombres excede a la estatura de Lobo entre las
mujeres?
Solución
Para comparar las estaturas de Jordan y
Lobo, en relación con las poblaciones de
hombres y mujeres, necesitamos estandarizar
dichas estaturas convirtiendolas en
puntuaciones z
Jordan
Lobo
z
x  x 198  195

 0,6
s
5
x  x 195  189
z

 1,5
s
4
Interpretación:
La estatura de Jordan está a 0,6 desviaciones
estandar por arriba de la media de la estatura
de los hombres de 1,95, pero la estatura de
Lobo está a 1,5 desviaciones estándar por
arriba de la media.
La estatura de Lobo entre las mujeres es
relativamente mayor que la estatura de
Jordan entre los hombres
Puntuaciones Z
y valores infrecuentes
Se calificará a un valor como “infrecuente” o poco común si está
a más de dos (2) desviaciones estándar de la media.
Por lo tanto los valores infrecuentes tienen valores menores a -2
y mayores a 2
Si aplicamos este criterio ¿Cómo son las estaturas de Jordan y
Lobo?
Considere este último ejemplo e interprete
si el puntaje es frecuente o infrecuente:
Un Jugador famoso de la NBA Yao Ming
mide 216cm y otro, Nate Robinson mide
178cm
Calcule las puntuaciones estándar,
considerando la estatura promedio de
195cm y una desviación estándar de 5cm
Solución:
En el caso de Ming su puntuación estándar
está 4,2 desviaciones estándar sobre la
media de 195cm
Por lo que es una estatura infrecuente en la
NBA, en términos de ser mucho más alto de
lo esperado
En el caso de Robinson su puntuación
estándar está 3,4 desviaciones estándar
bajo la estatura promedio de la NBA
También es una estatura infrecuente pero en
términos de baja estatura
Considere:
Valores Infrecuentes
-3
-2
Valores Comunes
-1
0
z
Valores Infrecuentes
1
2
3
2. Percentiles
En una distribución de frecuencias usted podrá ordenar los
datos en 99 percentiles que se denotan P(1); P(2); P(3)…P(99).
Estos percentiles separan a los datos en 100 grupos, con
aproximadamente el 1% de los valores en cada grupo
También se conocen la División llamada Cuartiles que divide a
la distribución en cuatro partes iguales a través de tres cuartiles
Q1, Q2 y Q3
Q1 (Primer Cuartil):
Separa el 25% inferior de los valores ordenados, de manera
que al menos el 25% de los valores ordenados son menores o
iguales que Q1 y que al menos el 75% de los valores son
mayores o iguales que Q1
Q2 (Segundo Cuartil):
Igual a la Mediana, separa el 50% inferior de los
valores ordenados del 50% superior
Q3 (Tercer Cuartil):
Separa el 75% inferior de los valores
ordenados, de manera que al menos el 75% de
los valores ordenados son menores o iguales
que Q3 y que al menos el 25% de los valores
son mayores o iguales que Q3
El cálculo del Percentil está dado por la
siguiente fórmula:
númerode valores menoresque x
Percentil del valor x 
100
númerototal de valores
Ejemplo
Niveles de Nicotina en Fumadores
La siguiente tabla lista los 40 niveles
ordenados de nicotina de ciertos fumadores
A partir de la Tabla calcule el percentil
correspondiente al nivel de Nicotina 112
0
32
87
130
173
222
253
290
1
35
103
131
173
227
265
313
1
44
112
149
198
234
277
477
3
48
121
164
208
245
284
491
17
86
123
167
210
250
289
498
Solución:
12
Percentil del valor 112 
 100  30
40
Interpretación: el Nivel de Nicotina de 112
es el percentil 30
En el caso anterior hemos calculado como
obtener un valor percentil según un valor
muestral
En ocasiones queremos obtener el valor
muestral en función de un Percentil
determinado
Ejemplo: ¿Cuál es el valor muestral de
nicotina correspondiente al Percentil 68?
Para este calculo considere el siguiente
procedimiento:
1. Ordenar los datos de menor a mayor
2. Calcular un valor localizador L según la siguiente
fórmula:
n = Número total de datos
 k 
K = percentil buscado
L
n
 100
3. Si L no es entero redondear al Número entero
siguiente. Ej. Si L=7,1 redondear a 8 y ese es
nuestro localizador
4. Si L es entero ese es nuestro valor Localizador
5. En la serie ordenada de datos cuente desde el
menor hasta llegar al L-ésimo valor
En el caso de 8, contar desde el primer valor hasta
llegar al octavo valor y ese será nuestro percentil
buscado
Ejemplo:
Calcule el valor del P(68) en función de la serie
ordenada de datos respecto al nivel de
Nicotina
68
 k 
L
 40  27,2
n 
100
 100
Redondear a 28 pues el valor no es entero
Luego ir a la serie ordenada de casos y contar hasta 28 desde el primer
valor
En este caso el nivel de nicotina correspondiente al L=28 es 234
P(68) = 234