Transcript Amostragem

III - Amostragem

Prof. Herondino

População e amostra

 

População

uma população é o conjunto de todos os itens, objetos, coisas ou pessoas a respeito das quais a informação é desejada para a solução de um problema.

 

Amostra

Uma amostra é um grupo de itens selecionados por um método cuidadosamente concebido e projetado a partir de uma população.

Tipos e procedimento de amostragem

Amostragem Simples ou ocasional

  Todos os elementos da população têm igual probabilidade de serem escolhidos. Para uma população finita o processo deve ser sem reposição. Todos os elementos da população devem ser numerados. Para realizar o sorteio dos elementos devemos usar a Tabela de Números Aleatórios.

Amostragem Sistemática

  Sendo N o tamanho da população e n o tamanho da amostra desejado, define-se a quantidade chamado intervalo de amostragem. Faz-se um sorteio entre os números 1, 2, 3, ..., K, e se obtém o valor i, onde será o meu primeiro elemento, os demais elementos poderão ser calculados pelo termo geral de uma progressão aritmética.

Exemplo

 Suponha que uma empresa de telefonia fixa deseja saber o grau de satisfação de seus usuários com serviços prestados. O número de assinantes é da ordem de 50.000 e nos desejamos selecionar uma amostra aleatória de 1.000 assinantes com o intuito de obter a avaliação sobre os serviços.

   Solução via Amostragem Aleatória Simples: Devemos ter os assinantes numerados sequencialmente de 1 a 50.000 e somente após seriam selecionados os 1.000 assinantes. Vejamos usando o Excel .

Exemplo:

sorteio entre os números 1, 2, 3, ..., K

Amostragem estratificada

   É um processo de amostragem usado quando nos deparamos com populações heterogêneas, no qual pode-se distinguir subpopulações mais ou menos homogêneas, denominados estratos.

Após a determinação dos estratos, seleciona-se uma amostra aleatória de cada uma subpopulação (estrato).

As diversas subamostras retiradas das subpopulações devem ser proporcionais aos respectivos números de elementos dos estratos e guardarem a proporcionalidade em relação a variabilidade de cada estrato, obtendo-se uma estratificação ótima

Exemplo

  Vamos obter uma amostra estratificada de 10% da população para a pesquisa da estatura de 90 alunos de uma escola sendo que destes 54 sejam meninos e 36 sejam meninas.

São, portanto dois estratos (gênero feminino e gênero masculino) e queremos uma amostra de 10% da população .

Numeramos os alunos de 1 a 90, sendo que de 01 a 54 correspondem meninos e de 55 a 90, meninas.

Tabela de Números Aleatórios

57 28 92 90 80 22 56 79 53 18 53 03 27 05 40 28 22 53 18 03 – para os meninos; 57 90 80 56 – para as meninas;

Com reposição das amostras Sem reposição das amostras

V - Descrição e Apresentação dos Dados

Dados

 A palavra "dados" é um termo relativo, tratamento de dados comumente ocorre por etapas, e os "dados processados" a partir de uma etapa podem ser considerados os "dados brutos" do próximo. (Wikipédia)   Dados Brutos Em informática dados brutos (raw data) designam os dados/valores recolhidos e estocados tal qual foram adquiridos, sem terem sofrido o menor tratamento (Wikipédia)

Dados Brutos

 14 16 Suponhamos o seguintes dados Brutos como sendo a idade de alunos de uma turma de informática 12 14 13 14 11 15 12 17 13 14 11 14 12 13 13 12 14 14 15 13 13 15 12 16

Frequência

 A frequência de uma observação é o número de repetições dessa observação no conjunto de observações, ou ainda, é o número de vezes que conjuntos de dados aparecem em uma “população”.

Dados ou variável (Idade)

x i

11 12 13 14 15 16 17

f i

2 5 2 1 6 7 3 Frequência (nº de Alunos)

Frequências Relativas

A frequência relativa é o valor da frequência absoluta dividido pelo número total de observações.

Variável (idade)

x i

frequência absoluta (Nº de alunos)

f i

frequência relativa

f r

11 2 2/26 = 0,0769 12 13 5 6 5/26 = 0,1923 6/26 = 0,2308 14 15 16 17 TOTAL 7 3 2 1

N

 

f i

= 26 7/26 = 0,2692 3/26 = 0,1154 2/26 = 0,0769 1/26 = 0,0385 1,0000

Frequência Acumulada

Variável

x i

freqüência absoluta

f i

freqüência relativa

f r

frequência absoluta acumulada

f a

11 2 2/26 = 0,0769 2

frequência relativa acumulada

f ra

2/26 = 0,0769 12 13 14 15 16 17 TOTAL 1 

f i

= 26 3 2 5 6 7 5/26 = 0,1923 6/26 = 0,2308 7/26 = 0,2692 3/26 = 0,1154 2/26 = 0,0769 1/26 = 0,0385 

f r

=1,0000 7 13 20 23 25 26 7/26 = 0,2692 13/26 = 0,5000 20/26 = 0,7692 23/26 = 0,8846 25/26 = 0,9615 26/26 = 1,0000

Regras de arredondamento na Numeração Decimal

   Norma ABNT NBR 5891 1) Quando o algarismo imediatamente seguinte ao último algarismo a ser conservado for inferior a 5, o último algarismo a ser conservado permanecerá sem modificação Exemplo: 1,333 3 arredondado à primeira decimal tornar-se-á 1,3

Regras de arredondamento na Numeração Decimal

   2) Quando o algarismo imediatamente seguinte ao último algarismo a ser conservado for superior a 5, ou, sendo 5,

for seguido de no mínimo um algarismo diferente

de zero, o último algarismo a ser conservado deverá ser

aumentado de uma unidade

Exemplo 1,666 6 arredondado à primeira decimal tornar-se-á: 1,7.

4,850 5 arredondados à primeira decimal tornar-se-ão : 4,9.

Regras de arredondamento na Numeração Decimal

  3) Quando o algarismo imediatamente seguinte ao

último algarismo a ser conservado for 5 seguido de

zeros, dever-se-á arredondar o algarismo a ser conservado para o algarismo par mais próximo. Consequentemente, o último a ser retirado, se for ímpar, aumentará uma unidade.

Exemplo: 4,550 0 arredondados à primeira decimal tornar-se-ão: 4,6.

Regras de arredondamento na Numeração Decimal

4) Quando o algarismo imediatamente seguinte ao último a ser conservado for 5 seguido de zeros, se for par o algarismo a ser conservado, ele permanecerá sem

modificação.

 Exemplo: 4,850 0 arredondados à primeira decimal tornar-se-ão: 4,8.

Atividade - III

1.

2.

Verificar a altura em centímetro de cada aluno da turma e construir uma sequência de Dados Brutos; A partir dos Dados Brutos obtidos, construir a distribuição de frequência absoluta simples, a frequência relativa, frequência acumulada e frequência relativa acumulada. Para o arredondamento utilize a regra da ABNT 5891.

Histograma

  Um histograma é uma representação gráfica de uma única variável que representa a frequência de ocorrências (valores dos dados) dentro de categorias de dados.

O histograma tanto pode ser representado para as frequências absolutas como para as frequências relativas.

Histograma de frequência acumulada (ou ogiva)

 histograma de frequência acumulada (ou ogiva) é a representação gráfica do comportamento da frequência acumulada.

Distribuição de Frequência em Classe

      Quando tratamos de variáveis quantitativas contínuas os valores observados devem ser tabulados em intervalos de classes. Para a determinação dessas classes não existe uma regra pré estabelecida, sendo necessário um pouco de tentativa e erro para a solução mais adequada.

1. Definir o número de classes

Se n representa o número de observações (na amostra ou na população, conforme for o caso) o número aproximado de classes pode ser calculado por Número de Classes = arredondando os resultados. Eexemplo : Se n = 18 e podemos adotar um número de 5 classes, que será razoável.

   2. Calcular a amplitude das classes Essa será obtida conhecendo-se o número de classes e amplitude total dos dados. A amplitude total dos dados é o resultado da subtração valor máximo - valor mínimo da série de dados Amplitude de classe = Valor Max Valor Min

número

de classes

 

2. Preparar a tabela de seleção com os limites de cada classe

O limite superior de cada classe é aberto (e consequentemente, o limite inferior de cada classe é fechado), ou seja, cada intervalo de classe não inclui o valor de seu limite superior, com exceção da última classe

Referência

 HAIR, Joseph F. et al. Análise Multivariada de Dados. 5ª Porto Alegre, Rs: Bookman, 1998. 51 p.