Transcript cap06
ESTATÍSTICA APLICADA Capítulo 6 Estimativas e Tamanho de Amostras
Prof. Paulo Renato de Morais
Introdução à Estimação
Estimadores
1.
2.
3.
Variáveis aleatórias usadas para estimar um parâmetro populacional Média amostral, proporção amostral, mediana amostral Exemplo: Média amostral `
x
é um estimador da média populacional m Se `
x
= 50, então 50 é a
estimativa
de m Base teórica é a distribuição amostral
Propriedades da Distribuição Amostral da Média
1.
Não-viciada Média da distribuição igual à média populacional 2. Eficiente Média amostral aproxima-se mais da média populacional do que qualquer outro estimador não-viciado 3. Consistente Quando tamanho da amostra cresce, variação da média amostral decresce
Não-Viciada P(
`
X) Não-viciada Viciada A C
m `
X
Eficiente P(
`
X) Distribuição amostral da média A B
m
Distribuição amostral da mediana
`
X
Consistente P(
`
X) Amostra maior A B
m
Amostra menor
`
X
Processo de Estimação População Amostra Aleatória Média,
m
, é
J
desconhecida
J J J
Amostra
J J J J J
Média
`
X = 50
J
Tenho 95% de confiança que
m
está entre 42 e 58.
Parâmetros Desconhecidos da População são Estimados
Estimar parâmetro populacional...
Média m Proporção
p
Variância Diferenças s
2
m
1 -
m
2
com estatística amostral `
x
`
x
1
s
2 -
`
x
2
Métodos de Estimação Estimação por Ponto Estimação Estimação por Intervalo
Estimação por Ponto
Estimação por Ponto
1.
2.
3.
Proporciona um único valor Baseada em observações de 1 amostra Não dá informação sobre quão perto o valor está do parâmetro populacional desconhecido Exemplo: Média amostral `
x
= 50 é estimativa por ponto da média populacional desconhecida
Estimação por Intervalo
Estimação por Intervalo
1. Proporciona intervalo de valores Baseada em observações de 1 amostra 2.
3.
Dá informação sobre proximidade do parâmetro populacional desconhecido Afirmação em termos de probabilidade Saber a proximidade exata requer conhecer o parâmetro populacional desconhecido Exemplo: média populacional desconhecida está entre 42 e 58 com 95% de confiança
Elementos Chaves da Estimação por Intervalo Uma probabilidade que o parâmetro populacional esteja em algum lugar dentro do intervalo.
Intervalo de confiança Estatística amostral (estimativa por ponto) Limite de confiança (inferior) Limite de confiança (superior)
Limites de Confiança para a Média Populacional Parâmetro = Estatística ± Erro
( 1 ) (2) (3) (4) ( 5 ) m
X
Erro Erro
X
m
Z
X
s
x
m
Erro
m
X
Z
s
Z
s
x
x
ou
Erro
s
x X
m © 1984-1994 T/Maker Co.
Nível de Confiança
1.
Probabilidade que o parâmetro populacional desconhecido esteja dentro do intervalo 2. Denotado por (1 a a) % é a probabilidade que o parâmetro
não
esteja no intervalo 3.
Valores típicos são: 99%, 95%, 90%
Intervalos e Nível de Confiança Distribuição Amostral da Média
a
/2 Intervalos vão de X - Z
s `
X
`
X + Z
s `
X a
s
_ x 1 -
a m `
x =
m a
/2
_
X Número grande de intervalos (1 -
a
) % dos intervalos contêm
m
.
a
% não.
Fatores que Afetam o Comprimento do Intervalo
1.
Dispersão dos dados Medida por s 2. Tamanho da amostra s ` X = s /
n
3.
Nível de confiança (1 a ) Afeta Z
Intervalos vão de
`
X - Z
s `
X a
`
X + Z
s `
X
© 1984-1994 T/Maker Co.
Intervalo de Confiança para Estimar a Média (Amostra Grande)
Intervalo de Confiança para a Média (Amostra Grande)
1.
Hipóteses: Tamanho da amostra no mínimo 30 (
n
Amostragem aleatória 30) Se o desvio padrão populacional é desconhecido, use o desvio padrão amostral 2.
Intervalo de Confiança:
X
Z
a
/ 2
s
n X
Z
a
/ 2
s
n
Exemplo de Estimação da Média (Amostra Grande)
A média de uma amostra aleatória com
n
= 36 é ` X = 50. Construa um intervalo com 95% de confiança para m se s = 12.
Exemplo de Estimação da Média (Amostra Grande)
A média de uma amostra aleatória com
n
= 36 é ` X = 50. Construa um intervalo com 95% de confiança para m se s = 12.
X Z a / 2 s n m X Z a / 2 50 1 , 96 12 m 36 46 , 08 m 50 1 , 96 53 , 92 s n 12 36
Questão
Você é um inspetor de qualidade. O s para garrafas de 2 litros é
0,05
litros. Uma amostra aleatória de
100
garrafas forneceu `
X = 1,99
litros. Qual é o intervalo com
90% média
de confiança para a verdadeira da quantidade em garrafas de 2 litros?
2 liter
© 1984-1994 T/Maker Co.
Solução do Intervalo de Confiança
X Z a / 2 s n m X Z a / 2 s n 1 , 99 1 , 645 0 , 05 100 m 1 , 99 1 , 645 0 , 05 100 1 , 982 m 1 , 998
Achando o Tamanho da Amostra
Achando o Tamanho da Amostra para Estimar
m ( (1) (2) 3 ) Z Erro X s x m Z s x Erro s x Z s n n Z 2 s 2 Erro 2
Eu não quero amostra muito grande nem muito pequena!
Exemplo de Tamanho da Amostra
Que tamanho de amostra é necessário para se estar com
90%
correto dentro de de confiança de se estar
5
? Um estudo piloto mostrou que o desvio padrão é
45
.
Exemplo de Tamanho da Amostra
Que tamanho de amostra é necessário para se estar com
90%
correto dentro de de confiança de se estar
5
? Um estudo piloto mostrou que o desvio padrão é
45
.
n ( Z a / 2 ) 2 s 2 Erro 2 1 , 645 2 5 2 45 2 219 , 2 220
Questão
Você trabalha em Recursos Humanos. Você deseja saber o gasto médio dos empregados com saúde. Você quer ter uma confiança de
95%
que a
média
amostral esteja dentro de
± $50
. Um estudo piloto mostrou que s é
$400
. Que
tamanho de amostra
você usará?
Solução do Tamanho da Amostra
n ( Z a / 2 ) 2 s 2 Erro 2 1 , 96 2 400 245 , 50 2 86 2 246
Correção para População Finita
Correção para População Finita
1.
Usada quando tamanho da amostra é grande comparada ao tamanho da população Se
n
/
N
> 0,05, use o fator de correção
Correção para População Finita
1.
2.
3.
Usada quando tamanho da amostra é grande comparada ao tamanho da população Se
n
/
N
> 0,05, use o fator de correção Fator de correção:
N
n N
Intervalo de confiança para média com fator:
X
t
a
n
1
S n
m
X
t
a
n
1
S n
Diminui o comprimento do intervalo de confiança
Intervalo de Confiança para Estimar a Média (Amostra Pequena)
Intervalo de Confiança para a Média (Amostra Pequena)
1.
2.
Hipóteses: Tamanho da amostra menor que 30 (
n
< 30) População distribuída normalmente Desvio padrão populacional desconhecido Usa distribuição t de Student
Intervalo de Confiança para a Média (Amostra Pequena)
1.
2.
3.
Hipóteses: Tamanho da amostra menor que 30 (
n
< 30) População distribuída normalmente Desvio padrão populacional desconhecido Usa distribuição t de Student Intervalo de confiança:
S X
t
a
n
1
X n
t
a
n
1
S n
Distribuição t de Student Forma de sino Normal Padrão Simétrica Cauda mais ‘longa’ t (gl = 13) Z t 0
Tabela da t de Student
v t
.10
t
.05
t
.025
1 3.078 6.314
12.706
2 1.886
2.920
4.303
3 1.638 2.353 3.182
a
/ 2 Suponha: n = 3 gl = n - 1 = 2
a
= 0,10
a
/2 = 0,05 0,05 0 2,920 t Valores de t
Graus de Liberdade (gl)
1.
Número de observações que podem variar após a estatística amostral ser calculada 2. Exemplo: Soma de 3 números é 6
X
1 =
X
2 =
X
3 = Soma = 6
Graus de Liberdade (gl)
1.
Número de observações que podem variar após a estatística amostral ser calculada 2. Exemplo: Soma de 3 números é 6
X
1 = 1 (Ou outro número)
X
2 = 2 (Ou outro número)
X
3 =
3
(Não pode variar) Soma = 6 Graus de liberdade =
n
-1 = 3 -1 = 2
Exemplo de Estimação da Média (Amostra Pequena)
Uma amostra aleatória com
n
= 25 tem
x
= 50 e
s
= 8. Construa um intervalo com 95% de confiança para m .
Exemplo de Estimação da Média (Amostra Pequena)
Uma amostra aleatória com
n
= 25 tem
x
= 50 e
s
= 8. Construa um intervalo com 95% de confiança para m .
X t a / 2 , n 1 S n m X t a / 2 , n 1 50 2 , 0639 8 m 25 46 , 69 m 50 2 , 0639 53 , 30 S n 8 25
Questão
Você é um analista estudando o tempo de manufatura de um produto. Os seguintes tempos foram medidos (em min.):
3,6; 4,2; 4,0; 3,5; 3,8; 3,1
.
Qual é o intervalo com
médio
de manufatura?
90%
de confiança para o tempo
Solução do Intervalo de Confiança
`
X = 3,7 S = 0,38987 n = 6, gl = n - 1 = 6 - 1 = 5 S /
n = 0,38987 /
6 = 0,1592 t 0,05;5 = 2,0150 3,7 - (2,015)(0,1592)
m
3,7 + (2,015)(0,1592) 3,379
m
4,021
Intervalo de Confiança para uma Proporção
Dados Qualitativos
1.
Variáveis aleatórias qualitativas são classificadas por um atributo p.e., qualidade (perfeita, defeituosa) 2. As medidas refletem n o em cada categoria 3. Escala nominal ou ordinal 4. Exemplos: As duas peças fabricadas encaixam ou não? A dimensão da peça está dentro do especificado ou não?
Proporções
1.
2.
3.
Envolve variáveis qualitativas Fração ou % da população na categoria Se houver apenas dois resultados possíveis, distribuição binomial Possui ou não possui a característica
Proporções
1.
2.
Envolve variáveis qualitativas Fração ou % da população na categoria 3. Se houver apenas dois resultados possíveis, distribuição binomial Possui ou não possui a característica 4.
Proporção amostral (
p
)
x n
número de sucessos tamanho da amostra
Distribuição Amostral da Proporção
1.
Aproximada por distribuição normal
n p
3
n p
( 1 ) 2.
3.
exclui 0 ou n Média m
p
s Desvio padrão
p
( 1
n p
)
Distribuição Amostral .3
^ P(P ) .2
.1
.0
.0
.2
m
.4
.6
p
.8
1.0
^ P
Intervalo de Confiança para a Proporção
1.
Hipóteses: Dois resultados possíveis População segue distribuição binomial Aproximação pela Normal pode ser usada
n p
3
n p
( 1 ) não inclui 0 ou n 2.
Intervalo de confiança:
z
a
2
1
n
)
z
a
2
1
n
)
Exemplo de Estimação da Proporção
Uma amostra aleatória de 400 alunos mostrou que 32 fizeram pós-graduação. Construa um intervalo com 95% de confiança para
p
.
Exemplo de Estimação da Proporção
Uma amostra aleatória de 400 alunos mostrou que 32 fizeram pós-graduação. Construa um intervalo com 95% de confiança para
p
.
pˆ Z a / 2 pˆ ( 1 pˆ ) p pˆ Z a / 2 n pˆ ( 1 pˆ ) n 0 , 08 1 , 96 0 , 08 ( 1 0 , 08 ) p 0 , 08 1 , 96 400 0 , 08 ( 1 0 , 08 ) 400 0 , 053 p 0 , 107
Questão
Você é responsável por anúncios no jornal. Você quer encontrar a % de erros. De
200
anúncios,
35
tinham erros. Qual é o intervalo com
90%
de confiança para a
proporção
de erros?
Solução do Intervalo de Confiança
pˆ Z a / 2 pˆ ( 1 pˆ ) p pˆ Z a / 2 n pˆ ( 1 pˆ ) n 0 , 175 1 , 645 0 , 175 0 , 825 p 0 , 175 1 , 645 200 0 , 175 0 , 825 200 0 , 1308 p 0 , 2192
Tamanho da Amostra para Estimar a Proporção p
Tamanho da Amostra para Estimar a Proporção p
1. Quando se conhece uma estimativa n ( Z a / 2 ) 2 pˆ Erro 2 ( 1 pˆ ) pˆ 2.
Quando não se conhece uma estimativa n ( Z a / 2 ) 2 4 Erro 2
Exemplo de Tamanho da Amostra para Estimar a Proporção p
Que tamanho de amostra é necessário para se estimar a proporção de motoristas que falam ao celular enquanto dirigem com
95%
de confiança de se estar correto dentro de uma margem de erro de
3%
?
A) Suponha que um estudo piloto mostrou que
18%
dos motoristas falam ao celular.
B) Suponha que não se tem qualquer informação sobre essa proporção.
Exemplo de Tamanho da Amostra para Estimar a Proporção p
A) n ( Z a / 2 ) 2 pˆ ( 1 Erro 2 pˆ ) 1 , 96 2 0 , 18 0 , 03 2 0 , 82 630 , 02 631 B) n ( Z a / 2 ) 2 4 Erro 2 1 , 96 2 4 0 , 03 2 1 .
067 , 11 1 .
068
Intervalo de Confiança para a Variância
Intervalo de Confiança para a Variância
1.
Hipóteses: Amostragem aleatória População segue distribuição normal 2. Usa a distribuição qui-quadrado 3.
Intervalo de confiança: ( n 1 ) s 2 2 a / 2 , n 1 s 2 ( n 1 ) s 2 2 1 a / 2 , n 1
Exemplo de Estimação da Variância
Uma amostra aleatória com
n
= 25 tem
s 2
= 8. Construa um intervalo com 95% de confiança para s 2 .
Exemplo de Estimação da Variância
Uma amostra aleatória com
n
= 25 tem
s 2
= 8. Construa um intervalo com 95% de confiança para s 2 .
( n 1 ) s 2 / 2 , n 1 ( 25 1 ) 8 39 , 364 s 2 s 2 ( ( n 25 12 , 1 ) 1 ) s 401 2 2 1 a / 2 , n 1 8 4 , 88 s 2 15 , 48
Questão
Você é um analista estudando o tempo de manufatura de um produto. Os seguintes tempos foram medidos (em min.):
3,6; 4,2; 4,0; 3,5; 3,8; 3,1
.
Qual é o intervalo com
90%
de confiança para a variância do tempo de manufatura?
Solução do Intervalo de Confiança
`
X = 3,7 S = 0,38987 S
2
= 0,152 n = 6, gl = n - 1 = 6 - 1 = 5
2 0,05;5 = 11,071
2 0,95;5 = 1,145 5 (0,152)/11,071
s 2
5 (0,152)/1,145 0,06865
s 2
0,66376
0,26201
s
0,81471