Prueba de hipótesis de 1 muestra
Download
Report
Transcript Prueba de hipótesis de 1 muestra
Estadística Administrativa II
Período 2014-3
5 pasos para probar hipótesis
1
Temario
› Procedimiento de 5 pasos para probar una hipótesis
› Pruebas de significancia de una cola
› Prueba de significancia de 2 colas
› Pruebas para la medida de una población, desviación
estándar conocida
› Valor p en una prueba de hipótesis
2
Hipótesis
Es una declaración relativa a una poblacional.
3
Afirmación relativa a un parámetro de la población
sujeta a verificación.
Parámetro
Estadístico
: Población
: Muestra
Hipótesis
› En la mayoría de los casos, la población es tan grande que
no es posible estudiarla completamente.
– Entrevistar a todos los campesinos del País para saber qué tipo de
productos están sembrando.
› En muchos casos, analizar la población equivaldría a
eliminarla.
– Analizar el sabor de todo el café que el País va a exportar.
› Una opción para medir o entrevistar a toda la población, es
tomar una muestra lo suficientemente representativa que
simule ser la población.
4
Prueba de hipótesis
5
Procedimiento basado en evidencia de la muestra y
la teoría de la probabilidad para determinar si la
hipótesis es una afirmación razonable.
Procedimiento de 5 pasos para probar una
hipótesis
› Paso 1
Establecer la hipótesis nula y la alternativa
› Paso 2
Seleccionar un nivel de significancia
› Paso 3
Identificar el estadístico de la prueba
› Paso 4
Formular una regla para tomar decisiones
› Paso 5
Tomar una decisión
6
Paso 1: Establecer la hipótesis nula (H0) y la
hipótesis alternativa (H1)
Establecer la hipótesis que se quiere probar. Recibe el nombre de
hipótesis nula y se identifica con la letra hache en mayúscula
subíndice cero. La mayúscula representa la hipótesis y el 0 implica
que “no hay diferencia”.
Si la hipótesis nula no se rechaza con base en los datos de la
muestra, no es posible decir que la hipótesis nula sea verdadera.
𝐻0 : 𝐸𝑥𝑝𝑟𝑒𝑠𝑖ó𝑛
𝐻𝑎 : 𝐸𝑥𝑝𝑟𝑒𝑠𝑖ó𝑛 𝑐𝑜𝑛𝑡𝑟𝑎𝑟𝑖𝑎
7
Ejemplo . . .
La velocidad promedio de los automóviles que pasan por el desvío
a Lima es de 68 millas por hora.
H0 : μ = 68
Ha : μ ≠ 68
En el 2010, el salario mínimo de un graduado de la universidad
fue de L.10,000.00
H0 : μ = 10,000
Ha : μ ≠ 10,000
80% de los jugadores asiduos a la Loto jamás gana más de
L.1,000 en un juego.
H0 : μ >1,000
Ha : μ ≤ 1,000
8
Paso 2: Seleccionar el nivel de significancia
𝛼
Se representa por la letra griega Alfa. También es conocida como
“nivel de riesgo”.
No existe ningún nivel que se aplique a todas las pruebas. Existen
algunas convenciones para utilizar ciertos porcentajes; pero, todo
depende de los que realizan los estudios o investigaciones.
Convenciones
Proyectos de Investigación (consumidores)
Control de calidad
Encuestas políticas
0.05
0.01
0.10
Nivel de significancia es el complemento de nivel de confianza
9
Significancia de una y dos colas
Por la forma en que está planteada una hipótesis se determina
si es de una o de dos colas.
10
Dos colas
𝐻0 : 𝜇 = 𝑎
𝑈𝑛𝑎 𝑐𝑜𝑙𝑎
𝐻0 : 𝜇 ≤ 𝑎
𝑈𝑛𝑎 𝑐𝑜𝑙𝑎
𝐻0 : 𝜇 ≥ 𝑎
Ejemplo . . .
Un articulo reciente indicó que el tiempo de uso medio de los
aviones comerciales estadounidenses es de 15 años. Determinar la
hipótesis y el nivel de significancia.
𝐻0 : 𝜇 = 15
𝐻𝑎 : 𝜇 ≠ 15
Nivel de significancia
5%
(Nivel de riesgo)
𝛼 = 0.05
11
Ejemplo . . .
Una investigación de mercados sobre la aceptación de un dentífrico con
sabor a guanábana indicó que la edad promedio de los usuarios más
interesados menor a 12 años. Determinar la hipótesis y el nivel de
riesgo
𝐻0 : 𝜇 < 12
𝐻𝑎 : 𝜇 ≥ 12
Nivel de significancia
5%
(Nivel de riesgo)
𝛼 = 0.05
12
Ejemplo . . .
Una distribuidora de calzado está probando un nuevo diseño y ha
estado haciendo encuestas sobre las edades de los clientes que
prefieren el nuevo modelo. La edad promedio ha sido de mayores de 18
años y se desea probar que este hipótesis se mantiene con un nivel de
significancia de 0.10.
𝐻0 : 𝜇 > 18
𝐻𝑎 : 𝜇 ≤ 18
Nivel de significancia
10%
(Nivel de riesgo)
𝛼 = 0.10
13
¿por qué no se recomienda el
nivel de confiabilidad del
100%?
14
La estadística es una ciencia basada en probabilidades, por la
constante intervención del azar y el riesgo de equivocación
siempre existe.
Tipos de errores en pruebas
Hipótesis nula
H0 verdadera
H0 falsa
No rechaza H0
Correcto
Error tipo II
Rechaza H0
Error tipo I
Correcto
› Es posible que una hipótesis nula se rechace aun
cuando ésta sea verdadera.
› Es posible que la hipótesis nula se acepte aun cuando
ésta sea falsa.
15
Ejemplo . . .
En un Banco se recibió un lote de plástico para tarjetas de
débito. Se tomó una muestra de 50 plásticos y reveló que 4
de ellos venían con defecto de fábrica. El estándar del Banco
indica que se acepta un 5% de plásticos con defecto de
fábrica.
En la compra de este mes, 4 de los 50 plásticos venían con
defecto de fábrica; esto indica que el 8% de la muestra viene
con defecto de fábrica.
El responsable del departamento rechazó el producto.
¿Hizo bien en rechazarlo?
16
. . . Ejemplo
¿Hizo
bien en rechazarlo?
Escenario 1
› Depende
› Supongamos que los 50 plásticos que eligió es el 10% del
total de plásticos recibidos.
› El lote completo está compuesto por 500 plásticos
› Si se hubieran revisado los 500 y resultara que solo esos 4
venían dañados, eso significaría que solo el 0.8% venía con
defecto de fábrica.
› La hipótesis se rechazó y debió haberse aceptado.
17
. . . Ejemplo
¿Hizo
bien en rechazarlo?
Escenario 2
› Depende
› Supongamos que los 50 plásticos que eligió es el 10% del
total de plásticos recibidos.
› El lote completo está compuesto por 500 plásticos
› Si se hubieran revisado los 500 y resultara que 30 venían
dañados, eso significaría que el 6% venía con defecto de
fábrica.
› La hipótesis se rechazó y la decisión fue correcta.
18
Ejemplo . . .
En un banco se negociado con un fabricante de tarjetas de
plástico, con el entendido de que si las tarjetas dañadas
superan el 5% del paquete, éste no será aceptado.
En esta semana, el encargado de compras recibió un paquete
de tarjetas. Seleccionó una muestra de 100 tarjetas, las que
fueron revisadas para ver su calidad; se evidenció que solo el
1% venía con daño (1 tarjeta).
El encargado de Compras aceptó el paquete.
¿Hizo bien en aceptarlo?
19
. . . Ejemplo
¿Hizo
bien en aceptarlo?
Escenario 1
› Depende
› Supongamos que los 100 plásticos que eligió es el 10% del
total de plásticos recibidos.
› El lote completo está compuesto por 1,000 plásticos
› Si se hubieran revisado los 1,000 plásticos y resultara que 60
venían dañados, eso significaría que el 6% venía con defecto
de fábrica.
› La hipótesis se aceptó y debió haberse rechazado.
20
Paso 3: Seleccionar el estadístico de
prueba
Se pueden utilizar varios; los más comunes son:
z
t
F
Χ2
Gauss
t-Student
f-Fisher
Chi cuadrada o ji-cuadrada
21
Ejemplo . . .
Se quiere probar que la velocidad media en la carretera hacia
Danlí es de 68 millas con una desviación estándar de 10
millas. Se toma una muestra de 100 vehículos los que
reportaron una media muestral de 70 millas. Calcular el
estadístico de prueba.
𝜇 = 68
𝜎 = 10
𝑋 = 70
𝑛 = 100
z=¿?
Se conoce la desviación estándar
𝑆𝑒 𝑑𝑒𝑏𝑒 𝑒𝑙𝑒𝑔𝑖𝑟 𝑒𝑙 𝑒𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑜 𝑎𝑝𝑟𝑜𝑝𝑖𝑎𝑑𝑜
22
Ejemplo . . .
Una distribuidora de productos alimenticios factura
semanalmente un promedio de L.20,000 por cliente. Se tomó
una muestra de 60 clientes y se encontró que el promedio de
compras realizadas en la semana pasada fue de L.18,000.
𝜇 = 20,000
𝜎 =¿ ?
𝑋 = 18,000
𝑛 = 60
t =¿?
No se conoce la desviación estándar
𝑆𝑒 𝑑𝑒𝑏𝑒 𝑒𝑙𝑒𝑔𝑖𝑟 𝑒𝑙 𝑒𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑜 𝑎𝑝𝑟𝑜𝑝𝑖𝑎𝑑𝑜
23
Ejemplo . . .
En una investigación de mercados se detectó que el 75% de
los clientes prefieren los submarinos de jamón de 15”. Se
tomó una muestra de 100 clientes en el transcurso de la
semana pasado y se determinó que el 70% de ellos había
comprado submarinos de jamón de 15”.
𝜋 = 0.75
𝜎 =¿ ?
𝑝 = 0.70
𝑛 = 100
t =¿?
No se conoce la desviación estándar
𝑆𝑒 𝑑𝑒𝑏𝑒 𝑒𝑙𝑒𝑔𝑖𝑟 𝑒𝑙 𝑒𝑠𝑡𝑎𝑑í𝑠𝑡𝑖𝑐𝑜 𝑎𝑝𝑟𝑜𝑝𝑖𝑎𝑑𝑜
24
Paso 4: Formular la regla de decisión
Es una afirmación sobre las condiciones
específicas en que se rechaza la hipótesis nula y
aquellas en las que no se rechaza.
La región o área de rechazo define la ubicación de
todos esos valores que son tan grandes o tan
pequeños que la probabilidad de que ocurran en
una hipótesis nula verdadera es muy remota.
25
Valor crítico
Punto de división entre la región en que se rechaza la
hipótesis nula y aquella en la que se acepta.
26
Cálculo del nivel crítico dos colas
Se pide un nivel de confianza del 95%, para una hipótesis nula igual
que un valor determinado.
El nivel de significancia se mide por el área que no corresponde al
nivel de confianza.
𝐻0 : 𝜇 = 𝑎
𝐻1 : 𝜇 ≠ 𝑎
𝑁𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎: 95%
Nivel de significancia: 5%
El valor crítico es el valor z en
donde se cambia de la validez de la
hipótesis nula a la alternativa.
Z=1.96
27
Cálculo del nivel crítico una cola
Se pide un nivel de confianza del 95%, para una hipótesis nula mayor
que un valor determinado.
El nivel de significancia se mide por el área que no corresponde al
nivel de confianza.
𝑁𝑖𝑣𝑒𝑙 𝑑𝑒 𝑐𝑜𝑛𝑓𝑖𝑎𝑛𝑧𝑎: 95%
Nivel de significancia: 5%
𝐻0 : 𝜇 ≤ 𝑎
𝐻1 : 𝜇 > 𝑎
El valor crítico es el valor z en
donde se cambia de la validez de la
hipótesis nula y la alternativa.
Z=1.65
28
Paso 5: Tomar decisión
En base a los resultados se decide si la hipótesis
se acepta o no.
Siempre existe el riesgo de que se cometa el error
de tipo I o tipo II.
Validar qué tan confiable es el resultado del
estadístico mediante el cálculo del valor p.
Valor p: Probabilidad de observar un valor
muestral tan extremo o más que el valor observado,
si la hipótesis nula es verdadera.
𝑝 ,α
29
Paso 5: Tomar decisión
Valor p de una prueba de hipótesis
𝑆𝑖 𝑝 < 𝛼 ≡ 𝐻0 𝑛𝑜 𝑠𝑒 𝑎𝑐𝑒𝑝𝑡𝑎
𝑆𝑖 𝑝 > 𝛼 ≡ 𝐻0 𝑛𝑜 𝑠𝑒 𝑟𝑒𝑐ℎ𝑎𝑧𝑎
IMPORTANCIA DE LA EVIDENCIA EN CONTRA DE H0
a)
0.10
hay cierta evidencia de que H0 no sea verdadera
b)
0.05
hay evidencia fuerte de que H0 no sea verdadera
c)
0.01
hay evidencia muy fuerte de que H0 no sea verdadera
d)
0.001
hay evidencia extremadamente fuerte de que H0 no sea verdadera
30
Ejemplo . . .
En una investigación de mercados, la regla de decisión está
calculada para un nivel de significancia de 0.01. La hipótesis
es a dos colas
El valor de z de la regla de decisión es ±2.58 (paso 3)
Al tomar la muestra y calcular el valor de z (datos de la
muestra) el resultado obtenido es ±1.55. (paso 5)
Al comparar con el resultado de la regla de decisión, se
observa que el valor obtenido es menor que 2.58. Por lo que
el valor de z está dentro del área de aceptación.
31
. . . Ejemplo
Regla de decisión:
z = 2.58
Resultados de la muestra:
z = 1.55
Nivel de significancia:
𝛼 = 0.01
Al calcular el área de la zona de rechazo para z=1.55 se
obtiene 0.0606 (0.5 – 0.4394) y al ser de 2 colas, p=0.1212.
0.1212 > 0.01
La hipótesis nula no se rechaza
≡
𝑝>𝛼
32
Ejemplo . . .
En una investigación de mercados, la regla de decisión está
calculada para un nivel de significancia de 0.05. La hipótesis
es a una cola con el área de rechazo es para valores mayores
El valor de z de la regla de decisión es +1.65 (paso 3)
Al tomar la muestra y calcular el valor de z (datos de la
muestra) el resultado obtenido es +1.72. (paso 5)
Al comparar con el resultado de la regla de decisión, se
observa que el valor obtenido es mayor que 1.65. Por lo que
el valor de z está dentro del área de rechazo.
33
. . . Ejemplo
Regla de decisión:
z = 1.65
Resultados de la muestra:
z = 1.72
Nivel de significancia:
𝛼 = 0.05
Al calcular el área de la zona de rechazo para z=1.72 se
obtiene 0.0427 (0.5 – 0.4573) y al ser de 1 cola, p=0.0427
0.0427 < 0.05
La hipótesis nula no se acepta
≡
𝑝<𝛼
34
35