Transcript cap06

ESTATÍSTICA APLICADA Capítulo 6 Estimativas e Tamanho de Amostras

Prof. Paulo Renato de Morais

Introdução à Estimação

Estimadores

1.

2.

3.

Variáveis aleatórias usadas para estimar um parâmetro populacional  Média amostral, proporção amostral, mediana amostral Exemplo: Média amostral `

x

é um estimador da média populacional m  Se `

x

= 50, então 50 é a

estimativa

de m Base teórica é a distribuição amostral

Propriedades da Distribuição Amostral da Média

1.

Não-viciada  Média da distribuição igual à média populacional 2. Eficiente  Média amostral aproxima-se mais da média populacional do que qualquer outro estimador não-viciado 3. Consistente  Quando tamanho da amostra cresce, variação da média amostral decresce

Não-Viciada P(

`

X) Não-viciada Viciada A C

m `

X

Eficiente P(

`

X) Distribuição amostral da média A B

m

Distribuição amostral da mediana

`

X

Consistente P(

`

X) Amostra maior A B

m

Amostra menor

`

X

Processo de Estimação População Amostra Aleatória Média,

m

, é

J

desconhecida

J J J

Amostra

J J J J J

Média

`

X = 50

J

Tenho 95% de confiança que

m

está entre 42 e 58.

Parâmetros Desconhecidos da População são Estimados

Estimar parâmetro populacional...

Média m Proporção

p

Variância Diferenças s

2

m

1 -

m

2

com estatística amostral `

x

`

x

1

s

2 -

`

x

2

Métodos de Estimação Estimação por Ponto Estimação Estimação por Intervalo

Estimação por Ponto

Estimação por Ponto

1.

2.

3.

Proporciona um único valor  Baseada em observações de 1 amostra Não dá informação sobre quão perto o valor está do parâmetro populacional desconhecido Exemplo: Média amostral `

x

= 50 é estimativa por ponto da média populacional desconhecida

Estimação por Intervalo

Estimação por Intervalo

1. Proporciona intervalo de valores  Baseada em observações de 1 amostra 2.

3.

Dá informação sobre proximidade do parâmetro populacional desconhecido  Afirmação em termos de probabilidade  Saber a proximidade exata requer conhecer o parâmetro populacional desconhecido Exemplo: média populacional desconhecida está entre 42 e 58 com 95% de confiança

Elementos Chaves da Estimação por Intervalo Uma probabilidade que o parâmetro populacional esteja em algum lugar dentro do intervalo.

Intervalo de confiança Estatística amostral (estimativa por ponto) Limite de confiança (inferior) Limite de confiança (superior)

Limites de Confiança para a Média Populacional Parâmetro = Estatística ± Erro

( 1 ) (2) (3) (4) ( 5 ) m 

X

Erro Erro

X

 m

Z

X

s 

x

m

Erro

m 

X

 

Z

s

Z

s

x

x

ou 

Erro

s

x X

 m © 1984-1994 T/Maker Co.

Nível de Confiança

1.

Probabilidade que o parâmetro populacional desconhecido esteja dentro do intervalo 2. Denotado por (1  a a) % é a probabilidade que o parâmetro

não

esteja no intervalo 3.

Valores típicos são: 99%, 95%, 90%

Intervalos e Nível de Confiança Distribuição Amostral da Média

a

/2 Intervalos vão de X - Z

s `

X

`

X + Z

s `

X a

s

_ x 1 -

a m `

x =

m a

/2

_

X Número grande de intervalos (1 -

a

) % dos intervalos contêm

m

.

a

% não.

Fatores que Afetam o Comprimento do Intervalo

1.

Dispersão dos dados  Medida por s 2. Tamanho da amostra  s ` X = s / 

n

3.

Nível de confiança (1 a )  Afeta Z

Intervalos vão de

`

X - Z

s `

X a

`

X + Z

s `

X

© 1984-1994 T/Maker Co.

Intervalo de Confiança para Estimar a Média (Amostra Grande)

Intervalo de Confiança para a Média (Amostra Grande)

1.

Hipóteses:  Tamanho da amostra no mínimo 30 (

n

  Amostragem aleatória 30)  Se o desvio padrão populacional é desconhecido, use o desvio padrão amostral 2.

Intervalo de Confiança:

X

Z

a

/ 2

 s

n X

Z

a

/ 2

 s

n

Exemplo de Estimação da Média (Amostra Grande)

A média de uma amostra aleatória com

n

= 36 é ` X = 50. Construa um intervalo com 95% de confiança para m se s = 12.

Exemplo de Estimação da Média (Amostra Grande)

A média de uma amostra aleatória com

n

= 36 é ` X = 50. Construa um intervalo com 95% de confiança para m se s = 12.

X  Z a / 2  s n  m  X  Z a / 2  50  1 , 96  12  m 36 46 , 08  m  50  1 , 96   53 , 92 s n 12 36

Questão

Você é um inspetor de qualidade. O s para garrafas de 2 litros é

0,05

litros. Uma amostra aleatória de

100

garrafas forneceu `

X = 1,99

litros. Qual é o intervalo com

90% média

de confiança para a verdadeira da quantidade em garrafas de 2 litros?

2 liter

© 1984-1994 T/Maker Co.

Solução do Intervalo de Confiança

X  Z a / 2  s n  m  X  Z a / 2  s n 1 , 99  1 , 645  0 , 05 100  m  1 , 99  1 , 645  0 , 05 100 1 , 982  m  1 , 998

Achando o Tamanho da Amostra

Achando o Tamanho da Amostra para Estimar

m ( (1) (2) 3 ) Z  Erro X  s x  m Z s x  Erro s x  Z s n n  Z 2 s 2 Erro 2

Eu não quero amostra muito grande nem muito pequena!

Exemplo de Tamanho da Amostra

Que tamanho de amostra é necessário para se estar com

90%

correto dentro de  de confiança de se estar

5

? Um estudo piloto mostrou que o desvio padrão é

45

.

Exemplo de Tamanho da Amostra

Que tamanho de amostra é necessário para se estar com

90%

correto dentro de  de confiança de se estar

5

? Um estudo piloto mostrou que o desvio padrão é

45

.

n  ( Z a / 2 ) 2 s 2 Erro 2  1 , 645 2 5 2  45 2  219 , 2  220

Questão

Você trabalha em Recursos Humanos. Você deseja saber o gasto médio dos empregados com saúde. Você quer ter uma confiança de

95%

que a

média

amostral esteja dentro de

± $50

. Um estudo piloto mostrou que s é

$400

. Que

tamanho de amostra

você usará?

Solução do Tamanho da Amostra

n  ( Z a / 2 ) 2 s 2 Erro 2  1 , 96 2   400 245 , 50 2 86  2 246

Correção para População Finita

Correção para População Finita

1.

Usada quando tamanho da amostra é grande comparada ao tamanho da população  Se

n

/

N

> 0,05, use o fator de correção

Correção para População Finita

1.

2.

3.

Usada quando tamanho da amostra é grande comparada ao tamanho da população  Se

n

/

N

> 0,05, use o fator de correção Fator de correção:

N

n N

Intervalo de confiança para média com fator:

X

 

t

a

n

1

S n

 m 

X

t

a

n

1

S n

Diminui o comprimento do intervalo de confiança

Intervalo de Confiança para Estimar a Média (Amostra Pequena)

Intervalo de Confiança para a Média (Amostra Pequena)

1.

2.

Hipóteses:   Tamanho da amostra menor que 30 (

n

< 30) População distribuída normalmente  Desvio padrão populacional desconhecido Usa distribuição t de Student

Intervalo de Confiança para a Média (Amostra Pequena)

1.

2.

3.

Hipóteses:   Tamanho da amostra menor que 30 (

n

< 30) População distribuída normalmente  Desvio padrão populacional desconhecido Usa distribuição t de Student Intervalo de confiança:

S X

t

a

n

1

X n

t

a

n

1

S n

Distribuição t de Student Forma de sino Normal Padrão Simétrica Cauda mais ‘longa’ t (gl = 13) Z t 0

Tabela da t de Student

v t

.10

t

.05

t

.025

1 3.078 6.314

12.706

2 1.886

2.920

4.303

3 1.638 2.353 3.182

a

/ 2 Suponha: n = 3 gl = n - 1 = 2

a

= 0,10

a

/2 = 0,05 0,05 0 2,920 t Valores de t

Graus de Liberdade (gl)

1.

Número de observações que podem variar após a estatística amostral ser calculada 2. Exemplo: Soma de 3 números é 6

X

1 =

X

2 =

X

3 = Soma = 6

Graus de Liberdade (gl)

1.

Número de observações que podem variar após a estatística amostral ser calculada 2. Exemplo: Soma de 3 números é 6

X

1 = 1 (Ou outro número)

X

2 = 2 (Ou outro número)

X

3 =

3

(Não pode variar) Soma = 6 Graus de liberdade =

n

-1 = 3 -1 = 2

Exemplo de Estimação da Média (Amostra Pequena)

Uma amostra aleatória com

n

= 25 tem

x

= 50 e

s

= 8. Construa um intervalo com 95% de confiança para m .

Exemplo de Estimação da Média (Amostra Pequena)

Uma amostra aleatória com

n

= 25 tem

x

= 50 e

s

= 8. Construa um intervalo com 95% de confiança para m .

X  t a / 2 , n  1  S n  m  X  t a / 2 , n  1  50  2 , 0639  8  m 25 46 , 69  m  50  2 , 0639   53 , 30 S n 8 25

Questão

Você é um analista estudando o tempo de manufatura de um produto. Os seguintes tempos foram medidos (em min.):

3,6; 4,2; 4,0; 3,5; 3,8; 3,1

.

Qual é o intervalo com

médio

de manufatura?

90%

de confiança para o tempo

Solução do Intervalo de Confiança

`

X = 3,7 S = 0,38987 n = 6, gl = n - 1 = 6 - 1 = 5 S /

n = 0,38987 /

6 = 0,1592 t 0,05;5 = 2,0150 3,7 - (2,015)(0,1592)

 m 

3,7 + (2,015)(0,1592) 3,379

 m 

4,021

Intervalo de Confiança para uma Proporção

Dados Qualitativos

1.

Variáveis aleatórias qualitativas são classificadas por um atributo  p.e., qualidade (perfeita, defeituosa) 2. As medidas refletem n o em cada categoria 3. Escala nominal ou ordinal 4. Exemplos:   As duas peças fabricadas encaixam ou não? A dimensão da peça está dentro do especificado ou não?

Proporções

1.

2.

3.

Envolve variáveis qualitativas Fração ou % da população na categoria Se houver apenas dois resultados possíveis, distribuição binomial  Possui ou não possui a característica

Proporções

1.

2.

Envolve variáveis qualitativas Fração ou % da população na categoria 3. Se houver apenas dois resultados possíveis, distribuição binomial  Possui ou não possui a característica 4.

Proporção amostral (

p

) 

x n

 número de sucessos tamanho da amostra

Distribuição Amostral da Proporção

1.

Aproximada por distribuição normal

n p

 3

n p

( 1  ) 2.

3.

exclui 0 ou n Média m 

p

s Desvio padrão 

p

( 1 

n p

)

Distribuição Amostral .3

^ P(P ) .2

.1

.0

.0

.2

m

.4

.6

p

.8

1.0

^ P

Intervalo de Confiança para a Proporção

1.

Hipóteses:   Dois resultados possíveis População segue distribuição binomial  Aproximação pela Normal pode ser usada 

n p

 3

n p

( 1  ) não inclui 0 ou n 2.

Intervalo de confiança: 

z

a

2

1

n

)

z

a

2

1

n

)

Exemplo de Estimação da Proporção

Uma amostra aleatória de 400 alunos mostrou que 32 fizeram pós-graduação. Construa um intervalo com 95% de confiança para

p

.

Exemplo de Estimação da Proporção

Uma amostra aleatória de 400 alunos mostrou que 32 fizeram pós-graduação. Construa um intervalo com 95% de confiança para

p

.

pˆ  Z a / 2  pˆ  ( 1  pˆ )  p  pˆ  Z a / 2  n pˆ  ( 1  pˆ ) n 0 , 08  1 , 96  0 , 08  ( 1  0 , 08 )  p  0 , 08  1 , 96  400 0 , 08  ( 1  0 , 08 ) 400 0 , 053  p  0 , 107

Questão

Você é responsável por anúncios no jornal. Você quer encontrar a % de erros. De

200

anúncios,

35

tinham erros. Qual é o intervalo com

90%

de confiança para a

proporção

de erros?

Solução do Intervalo de Confiança

pˆ  Z a / 2  pˆ  ( 1  pˆ )  p  pˆ  Z a / 2  n pˆ  ( 1  pˆ ) n 0 , 175  1 , 645  0 , 175  0 , 825  p  0 , 175  1 , 645  200 0 , 175  0 , 825 200 0 , 1308  p  0 , 2192

Tamanho da Amostra para Estimar a Proporção p

Tamanho da Amostra para Estimar a Proporção p

1. Quando se conhece uma estimativa n  ( Z a / 2 ) 2 pˆ Erro 2 ( 1  pˆ ) pˆ 2.

Quando não se conhece uma estimativa n  ( Z a / 2 ) 2 4  Erro 2

Exemplo de Tamanho da Amostra para Estimar a Proporção p

Que tamanho de amostra é necessário para se estimar a proporção de motoristas que falam ao celular enquanto dirigem com

95%

de confiança de se estar correto dentro de uma margem de erro de 

3%

?

A) Suponha que um estudo piloto mostrou que

18%

dos motoristas falam ao celular.

B) Suponha que não se tem qualquer informação sobre essa proporção.

Exemplo de Tamanho da Amostra para Estimar a Proporção p

A) n  ( Z a / 2 ) 2 pˆ ( 1  Erro 2 pˆ )  1 , 96 2  0 , 18 0 , 03 2  0 , 82  630 , 02  631 B) n  ( Z a / 2 ) 2 4  Erro 2  1 , 96 2 4  0 , 03 2  1 .

067 , 11  1 .

068

Intervalo de Confiança para a Variância

Intervalo de Confiança para a Variância

1.

Hipóteses:   Amostragem aleatória População segue distribuição normal 2. Usa a distribuição qui-quadrado 3.

Intervalo de confiança: ( n  1 ) s 2  2 a / 2 , n  1  s 2  ( n  1 ) s 2  2 1  a / 2 , n  1

Exemplo de Estimação da Variância

Uma amostra aleatória com

n

= 25 tem

s 2

= 8. Construa um intervalo com 95% de confiança para s 2 .

Exemplo de Estimação da Variância

Uma amostra aleatória com

n

= 25 tem

s 2

= 8. Construa um intervalo com 95% de confiança para s 2 .

( n  1 ) s 2  / 2 , n  1 ( 25  1 ) 8 39 , 364   s 2 s 2   ( ( n 25  12 ,  1 ) 1 ) s 401 2  2 1  a / 2 , n  1 8 4 , 88  s 2  15 , 48

Questão

Você é um analista estudando o tempo de manufatura de um produto. Os seguintes tempos foram medidos (em min.):

3,6; 4,2; 4,0; 3,5; 3,8; 3,1

.

Qual é o intervalo com

90%

de confiança para a variância do tempo de manufatura?

Solução do Intervalo de Confiança

`

X = 3,7 S = 0,38987 S

2

= 0,152 n = 6, gl = n - 1 = 6 - 1 = 5

2 0,05;5 = 11,071

2 0,95;5 = 1,145 5 (0,152)/11,071

 s 2 

5 (0,152)/1,145 0,06865

 s 2 

0,66376

0,26201

 s 

0,81471