Aula 9 - FMRP/USP
Download
Report
Transcript Aula 9 - FMRP/USP
AMOSTRAGEM
Def: Ramo da Estatística que estuda técnicas de planejamento de
pesquisa para possibilitar inferências sobre um universo a partir do
estudo de uma pequena parte de seus componentes.
Universo ou população = Conjunto de todos possíveis elementos
(todo o grupo) que podem fazer parte do estudo.
Exemplos:
Altura média dos médicos do HC. População = Todos os médicos do HC;
Percentual de peças com problemas numa fabrica.
População= Todas as peças fabricadas.
Efeitos de uma técnica nova de aprendizado para crianças com problemas
aprendizagem. População = Todas crianças com problemas de aprendizado
O pesquisador é que define a sua população, baseado no grau de
abrangência que pretende tirar do seu estudo. Pode ter restrições
geográficas, temporais ou de outras ordens.
AMOSTRA : Pequena parte da população que se deseja estudar, fração da população alvo.
Amostra1
População
de idosos
em Rib. Preto
Amostra2
Logicamente quanto mais semelhante, mais parecida, mais próxima for
a amostra da população mais consistente serão seus resultados, mais poderosas suas inferências, melhor o seu trabalho.
Vantagens: Custo menor, resultado em menor tempo, dados mais
fidedignos (??), ordem ética (novas drogas, vacinas).
Linhas gerais de PLANEJAMENTO AMOSTRAL idealizado:
1 - Definição dos objetivos da pesquisa (não só no plano amostral),
incluindo a população a ser amostrada, o universo dos possíveis
participantes
2 - Escolha das variáveis a serem observadas em cada unidade amostral,
conforme o tipo de variável há um tipo de cálculo de tamanho amostral.
3- Especificação do grau de precisão desejado (adiante mais detalhes),
quanto maior a amostra (até um certo ponto) maior o grau de certeza a
respeito dos resultados obtidos.
4 - Escolha dos instrumentos de medida (ex:questionário) e da forma
de abordagem (ex: clássico)
5 - Realização de uma prova experimental, piloto, pré-teste; é
conveniente pois testem-se os instrumentos de medida, o tempo, o custo,
possíveis interferências não previstas, fornece estimativas, orienta
ajustes necessários.
6 - Cálculo do tamanho da amostra, conhecido seus componentes.
Estratégias ou Tipos de Amostragem
Amostragem aleatória(probabilística) simples: Cada componente da
população tem a mesma chance de ser escolhido para compor a amostra,
através de uma seleção aleatória (ex: sorteio). Pode ser com ou sem
reposição.
Amostragem aleatória estratificada: A população é dividida em estratos
subpopulações, havendo maior homogeneidade dentro dos elementos de
cada estrato do que entre estratos diferentes. Os estratos devem respeitar
a proporcionalidade com a população. Por exemplo, se sabemos que 70%
dos elementos de uma escola são mulheres, 70% da nossa amostra deve
ser de mulheres. A amostra foi estratificada por sexo. Dentro de cada
estrato realiza-se uma amostragem simples.
Amostragem por conglomerados: Conglomerado é um conjunto de
unidades amostrais, p.ex. se crianças são a unidade amostral, as escolas
são conglomerados. Cada conglomerado é uma miniatura da população,
os conglomerados mais numerosos fornecerão mais unidades amostrais.
Amostragem por estágios múltiplos: É uma combinação de dois ou mais
planos amostrais. Por exemplo, pode-se fazer uma amostra aleatória
simples na qual as unidades amostrais são os conglomerados e dentro dos
conglomerados realizar-se uma amostra aleatória estratificada.
Ausência de resposta Falha na obtenção dados de uma unidade amostral.
Motivos: Unidade não encontrada; o entrevistado não sabe, não pode,
recusa-se a responder; perda, extravio do dado; apresenta viés...
Soluções: Reposição, substituição, da unidade amostral. Seleciona-se
aleatoriamente uma nova unidade amostral. Se não for possível, em
alguns casos pode-se estimar o valor que seria fornecido pela unidade
perdida.
Existem técnicas estatísticas que permitem estimar o valor perdido,
substituir pela média, pelo valor semelhante ao que outra unidade com
características parecidas forneceu,...
Tamanho da amostra
É conveniente, e cada vez mais cobrado por bancas e referers, planejar
a priori o tamanho da amostra, para que se possa ter uma amostra
suficiente para detectar uma diferença importante.
Por outro lado, se não há planejamento, uma amostra excessivamente
grande pode tornar diferenças irrelevantes em estatisticamente
significativas, fora o tempo e o dinheiro jogados fora.
Lembre sempre da diferença estatística e da diferença prática
O que ou quem determina o tamanho da amostra ??
A pergunta da pesquisa, a hipótese a ser testada pelo
pesquisador, conforme o desenho do estudo, o tipo das
variáveis e, secundariamente, a precisão que o pesquisador
deseja obter nos seus resultados.
Cálculo do tamanho da amostra para a realização
dos testes mais comuns
1 - Situação onde desejamos calcular um tamanho de amostra (n), com o
objetivo de compararmos a média obtida nos nossos dados com uma
média conhecida (da literatura, oficial, pesquisas anteriores),
sendo s estimado a partir de algo,ou de um pré-levantamento.
(s verdadeiro é desconhecido)
-Tipo de variável envolvida: Quantitativa contínua ou discreta, ou até
mesmo categórica ordinal .Teoricamente com distribuição Normal.
Conhecimentos a priori:
Diferença a ser detectada: É o valor da diferença entre a média
conhecida e a média que será estimada dos nossos dados, que é considerada
relevante pelo pesquisador. O valor que diferente da média conhecida
produzirá uma mudança de comportamento, de padrão, de conhecimento.
Ex: Sabe-se que pacientes com a doença X tem sobrevida de 40 meses,
uma nova terapia esta sendo testada e será considerada superior se
aumentar para 48 meses a sobrevida. Diferença a ser detectada é de 8 mese
Desvio padrão (s): Estimado a partir dos nossos dados ou de outra fonte.
Nível de significância (): Probabilidade de cometer o erro do tipo I, a
chance de dizer que as médias são diferentes quando são iguais.
H0: Média conhecida = média estim. X H1:Média conhecida média est.
Normalmente utiliza-se 0.05 (5%), se pretendemos diminuir a chance
desse erro para menos (0.01) paga-se o preço coletando uma amostra maio
Poder do teste (1-): Probabilidade de detectar uma real diferença, se ela
realmente existir. Normalmente utiliza-se 0.80 (80%), se pretendemos
aumentar esta chance para mais (90%) paga-se o preço coletando uma
amostra maior.
Tipo do teste: Bicaudal, se há diferença (para cima ou para baixo) entre
as médias ou Monocaudal, se interessa a diferença só para um lado.
Na maioria esmagadora das vezes utiliza-se o Bicaudal.
Portanto conhecimentos a priori: Diferença a ser detectada, Nível de
significância (), Desvio padrão (s), Poder do teste (1-) e Tipo do teste
Vamos em ‘Stats’, depois em
‘Power and Sample Size’ e
finalmente em ‘1 Sample t’
Surgirá a tela onde colocaremos
8 (48-40) no campo Difference,
0.80 em ‘Power values’ e 10 em
‘Sigma’ que é o desvio padrão.
Se clicarmos em ‘Options’
obteremos a seguinte tela.
Repare que o tipo do teste de hipóte
se já esta especificado como “Not
equal” que é o mesmo que bicaudal
bem como o nível de significância
de 0.05 . Para alterar alguns deles
basta alterar.
Clicando em OK voltamos na tela
anterior e novamente em OK temos
o resultado.
Power and Sample Size
1-Sample t Test
Testing mean = null (versus not =
null)
Calculating power for mean = null +
difference
Alpha = 0,05 Sigma = 10
Difference
8
Sample
Size
15
Target
Power
0,8000
Actual
Power
0,8213
Então para um = 0.05, 1- = 0.80,
um dp = 10, num teste bicaudal é
necessária uma amostra de tamanho
15 para se detectar um diferença de 8
em relação a 40. Se nesta amostra de
15 nossa média for 48 (ou 32) a
diferença entre a nossa média e a
conhecida será significativa (p 0.05
2 - Situação onde desejamos calcular um tamanho de amostra (n), com o
objetivo de compararmos duas médias obtidas de uma amostra.
Exemplo:Desejamos saber se o uso de anticoncepcional aumenta a pressão
sistólica nas mulheres de 30 a 35 anos. Os médicos estabeleceram que qua
quer diferença na ordem de 10 mmHg é importante. O desvio padrão é de
20 mmHg.
Tipos de variáveis envolvidas:Quantitativa contínua ou discreta, ou até
mesmo categórica ordinal que é a que será medida e a variável referente ao
grupos, que pode ser categórica ordinal, nominal ou uma var. quantitativa
que foi categorizada.Teoricamente a 1a. var.com distribuição Normal.
Conhecimentos a priori:
Diferença a ser detectada: Já especificada anteriormente
Desvio padrão: Já fornecido (na verdade teria de ser estudado).
Nível de significância, poder do teste e tipo do teste de hipótese:
Adotaremos o padrão, 0.05; 0.80, Bicaudal.
Voltamos à tela em ‘Power and
Sample Size’ e vamos em ‘2 Sample t’.
Surge uma nova tela onde
colocamos os valores já
definidos e damos OK
Temos então para as condições
estabelecidas que coletar uma
amostra
2-Sample t Test
Testing mean 1 = mean 2 (versus not =)
Calculating power for mean 1 = mean 2 + difference
Alpha = 0,05 Sigma = 20
Sample Target Actual
Difference
Size
Power
Power
10
64 0,8000 0,8015
Atenção, o n = 64
é o tamanho de
cada grupo
3 - Situação onde desejamos calcular um tamanho de amostra (n), com o
objetivo de compararmos mais de duas médias obtidas de uma amostra.
Exemplo:Desejamos saber se o uso de determinadas técnicas
fisioterapêuticas diminui o tempo de recuperação para determinada lesão.
Sabe-se que a técnica padrão leva 60 dias para a recuperação e serão
testadas 2 novas técnicas e uma terceira que é combinação das 2.
Como são técnicas custosas estamos interessados em diferenças a partir
de 15 dias. O desvio padrão é de 7 dias (estudos prévios).
Tipos de variáveis envolvidas:Quantitativa contínua ou discreta, ou até
mesmo categórica ordinal que é a que será medida e a variável referente
aos grupos, que pode ser categórica ordinal, nominal ou uma var. quantitat
que foi categorizada.Teoricamente a 1a. var.com distribuição Normal.
Conhecimentos a priori
Número de níveis, fatores, grupos, tratamentos,.. = 4
Diferença a ser detectada: Já especificada anteriormente
Desvio padrão: Já fornecido.
Nível de significância, poder do teste e tipo do teste de hipótese: Adotare
mos o padrão, 0.05; 0.80, Bicaudal.
Voltamos à tela em ‘Power and Sample
Size’ e vamos em ‘Oneway ANOVA’.
Na nova tela especificamos o no.
de tratamentos, a dif. mínima a ser
detectada, o poder e o dp e damos Ok.
Portanto necessitaríamos de uma
amostra de 6 elementos em cada
grupo.
One-way ANOVA
Sigma = 7 Alpha = 0,05 Number of Levels = 4
Sample Target Actual Maximum
SS Means
Size
Power
Power Difference
112,5
6 0,8000 0,8158 15
4 - Situação onde desejamos calcular um tamanho de amostra (n), com o
objetivo de compararmos uma proporção (percentual) em um experimento
com uma proporção conhecida da população.
Exemplo: Sabe-se que o percentual de crianças nascidas a pré-termo com
problemas de aprendizagem é 40%. Um novo método de ensino para estas
crianças foi desenvolvido, e será adotado se este percentual cair para 30%.
Tipos de variáveis envolvidas:Qualitativa nominal, ou outros tipos que
foram categorizadas.
Conhecimentos a priori:
Proporção na população: É o valor da proporção conhecido na população
de estudos anteriores, da literatura, ou outras fontes. Se não tiver a menor
idéia use 0.50 que fornecerá o maior tamanho de amostra. Segurança.
Proporção sugerida (a ser detectada): É a proporção que se pretende
observar, que se deseja obter.
Nível de significância, poder do teste e tipo do teste de hipótese: São
os mesmos Adotaremos o padrão, 0.05; 0.80, Bicaudal.
Voltamos à tela em ‘Power and Sample
Size’ e vamos em ‘1 Proportion’
Na nova tela inserimos a proporção
sugerida em ‘Alternative values of p’
o poder do teste e em ‘Hypothesized
p ‘ colocamos o valor da proporção
conhecido na população. E OK
Portanto se amostramos 182 crianças
e o percentual delas com problemas
for igual ou inferior a 30% (55) a
diferença entre 30% e 40% será
Test for One Proportion
Testing proportion = 0,4 (versus not = 0,4) significativa ( p 0.05)
O novo método será
Alpha = 0,05
Alternative Sample Target Actual
eficaz.
Proportion
0,300000
Size
182
Power
0,8000
Power
0,8020
5 - Situação onde desejamos calcular um tamanho de amostra (n), com o
objetivo de compararmos duas proporções obtidas em uma amostra
Exemplo: Pacientes tratados com a droga A apresentam índice de melhora
de 70%; os pacientes tratados com a droga B apresentam melhora de 85%.
Qual o tamanho da amostra para que a diferença entre estas proporções se
já significante?
Tipos de variáveis envolvidas:Duas vars. qualitativa nominis, ou outros
tipos que foram categorizadas. Uma para os tratamentos e a outra referente
ao índice de melhora.
Conhecimentos a priori:
As duas proporções estimadas: Proporções estimadas de estudos
anteriores, literatura, de experimentos prévios, da experiência.
Nível de significância, poder do teste e tipo do teste de hipótese: São
os mesmos Adotaremos o padrão, 0.05; 0.80, Bicaudal.
Voltamos pela enésima tela em ‘Power
and Sample Size’ e vamos em`2 Proportions
Na nova tela inserimos os valores das
nossas proporções (70% e 85%) e o
poder do teste. E OK
Portanto são necessário 121 pacientes
em cada tratamento para que 85%
seja significativamente superior a
70%.
Test for Two Proportions
Testing proportion 1 = proportion 2 (versus not =)
Calculating power for proportion 2 = 0,85
Alpha = 0,05
Sample Target Actual
Proportion 1
Size
Power
Power
0,700000
121 0,8000 0,8017
Nos estudos prospectivos, pode-se calcular um tamanho de amostra
apropriado, com poder de teste controlado. Trabalhos consistentes do
ponto de vista metodológico (estatístico).
Nos estudos retrospectivos, quando em muitas situações não é possível se
calcular um tamanho de amostra (não há mais dados disponíveis) pode-se
estimar o poder do teste ( probabilidade de se detectar uma real diferença
se ela realmente existir), de modo a termos real noção do nosso resultado.
Exemplo: Depois de uma revisão de pastas, verificou-se que pac. portado
res de um determinado gene Y tem glicemia média de 80 e os não portado
res de média de 100. Haviam 7 pacientes em cada grupo e dp foi 15.
Após irmos e ‘2- Sample t’ temos a tela
onde colocaremos o tamanho dos grupos
(7), a diferença detectada (100-80=20) e
o dp = 15 e OK
2-Sample t Test
Então para uma amostra de
Testing mean 1 = mean 2 (versus not =)
7 em cada grupo a chance de
Calculating power for mean 1 = mean 2
detectarmos uma diferença se
+ difference
Alpha = 0,05 Sigma = 15
ela realmente existir(com os
Sample
parâmetros estipulados) é de
Difference
Size
Power
63%.
20
7 0,6301
20
14 0,9243
Repare que se dobrarmos o tamanho
da amostra o poder do nosso teste vai para
92.4%
Para delineamentos mais complexos que exijam testes mais sofisticados
existem fórmulas de cálculo de tamanho de amostra específicos.
Quando não houver a menor idéia das diferenças a serem detectadas, ou das
estimativas necessárias para o cálculo de um tamanho amostral a priori, siga a
seguinte regra para responder à pergunta qual o tamanho da amostra ?
Dentro da sua possibilidade de TEMPO(de conclusão, de obter
amostras, de paciência,...) e de CUSTO (de obter amostras ou de
qquer origem) COLETE A MAIOR QUANTIDADE POSSÍVEL
DE DADOS.