Distribuição amostral de médias (DAM)

Download Report

Transcript Distribuição amostral de médias (DAM)

Estatística Experimental

Distribuição amostral das médias (introdução ao teste de hipótese )

Cap. 5 – Callegari-Jacques, S. M. Bioestatística: Princípios e Aplicações, 2003.

Profº: Glauco Vieira de Oliveira AGR/ICET/CUA/UFMT

Curva Normal

Propriedades ou Características da Curva Normal: Exemplo de uma curva normal de média (

) zero e desvio padrão (

) igual a 1.

OBSERVAÇÂO: O intervalo exato de x em que 95% da população está compreendida:

± 1,96 σ (Veja a tabela z)

Distribuição amostral das médias Exemplo

1) Considerando que a alcalinidade de um rio é de 19,6mg de CaCO 3 /L por meio de uma pesquisa em literatura, pergunta-se se a média de 16,2 mg (obtida de 16 observações recentes) indica que a alcalinidade no rio modificou?

Dados: Parâmetros: - média populacional (  = 19,6 mg) média amostral (

x

= 16,2 mg),

n

= 16 observações

Interpretação da pergunta em termos estatístico é:

A diferença obtida (16,2-19,6= -3,4mg) pode ser atribuída a uma diferença real (alcalinidade) ou a um erro aleatório? (já que se trata de uma amostra de 16 dados e não da população de valores possíveis do rio)

Desafio.

Como é o comportamento aleatório das médias amostrais (distribuição probabilística). ( x e

)

Distribuição amostral de médias (DAM)

População hipotética x = 10; 20; 30; 40.

média desses valores é 25 Vamos fazer retiradas de todas as amostras aleatórias possíveis da seguinte maneira: retirada dois a dois com reposição. Temos o seguinte resultado

:

x f fr Se x tiver distribuição normal as médias também apresentarão distribuição normal 0,0625 10 15 20 25 1 2 3 4 0,1250 0,1875 0,2500

0,3 0,25 0,2 0,15 0,1

30 35 40

3 2 1 16 0,1875 0,1250 0,0625 1

0,05 0 10 15 20 25 30

m édias am ostrais

35 40

Todas as médias possíveis, de amostras aleatórias de n = 2 elementos, obtidas de uma população onde x = 10, 20, 30 e 40

Distribuição amostral de médias (DAM)

Característica importante da distribuição amostral de médias (DAM) – Possui centro em amostrada). A variabilidade é expressa pelo desvio padrão das médias ou  (isto é, a média real da população

erro padrão da média , σ (x), dado por:

 (

x

)  

n

Onde n é o tamanho (nº de elementos) da amostra

Por possuir distribuição gaussiana: aproximadamente 68% das médias estão entre   (x) e pontos  +  (x); aproximadamente 95% estão entre  - 2  (x) e pontos  99% estão entre  - 3  (x) e pontos  + 2 + 3   (x); e aproximadamente (x).

erro padrão da média e Intervalo de Confiança

Significância estatística de um desvio – Obs: Um critério científico para o estabelecimento de uma diferença ou desvio significativo entre dois valores não pode ser uma questão de opinião dependente do sujeito, mas um critério objetivo.

– Ex: A média de altura de uma população é 175cm. Supondo que uma pessoa desta população tenha 180 cm, pergunta-se: este desvio é significativo?

O critério estatístico para significância de um desvio pressupõe que: a) a distribuição seja gaussiana. b) os valores desviantes sejam uma fração pequena da população e que esta fração seja determinada a priori Ex: Considera se como não-significativo todos os desvios ao redor da média que represente 95% dos valores da população. (olhar a tabela) Assim: A metade (47,5%) estão a direita da média populacional, ou seja, são maiores que a média, e a outra metade (47,5%) estão a esquerda da média populacional

Significância estatística de um desvio – 95% denomina-se a área de não-significancia (C) – Desvios para o estabelecimento de uma diferença significativa (alfa) α =1 – C → se C= 95% ou C= 0,95 então α = 0,05 ou 5%

Exercício (decisão sobre a significância de um desvio entre x e  )

Dado:

x

142,6; n

5

amostra (pesquisa)

 

129 ;

 

15

por revisão de literatura Pergunta-se O desvio da média amostral é devida ao acaso, considerando

  

um nível de 5% de significância?

(  

x

1 1 , , )  96 96   ( ( 

x x n

) )    15 129 129 5   1  1 , , 6 , 7 96 96 ( ( 6 6 , , 7 7 ) )   115 142 , , 9 1 Resposta: A média 142,6 não esta dentro da região de não rejeição. Assim para o critério escolhido ( α=5%) a média desvia-se significativamente média populacional (  ).

da