ESTATÍSTICA

Download Report

Transcript ESTATÍSTICA

INTRODUÇÃO À
ESTATÍSTICA
0011 0010 1010 1101 0001 0100 1011
PROFESSOR DORTA
1
2
4
ORIGEM
0011 0010 1010 1101 0001 0100 1011
• A palavra estatística, de origem latina,
significou por muito tempo “ciência sobre os
assuntos do Estado. Os que governavam,
sentindo necessidade de informações,
organizavam departamentos que tinham a
1
2
4
responsabilidade de fazer estas investigações.
ORIGEM
0011 0010 1010 1101 0001 0100 1011
• A palavra foi proposta pela primeira vez no
século XVII, em latim, por Schmeitzel na
Universidade de Lena e adotada pelo
acadêmico alemão Godofredo Achenwall.
Aparece como vocabulário na Enciclopédia
Britânica em 1797, e adquiriu um
significado de coleta e classificação de
dados, no início do século 19.
1
2
4
APLICAÇÃO
0011 0010 1010 1101 0001 0100 1011
• A Estatística trabalha com métodos
científicos para coleta, organização, resumo
e apresentação de dados e também para a
obtenção de conclusões e tomada de
decisões.
1
2
4
EXEMPLO DE APLICAÇÃO:
0011 0010 1010 1101 0001 0100 1011
• Todos nós temos um pouco de cientista.
Quase que diariamente, temos “palpites”
com relação a acontecimentos futuros em
nossas vidas, a fim de prever o que
acontecerá em novas situações ou
experiências.
1
2
4
• À medida em que essas situações ocorrem,
podemos, às vezes, confirmar nossas idéias;
0011 0010 1010 1101 0001 0100 1011
outras vezes, entretanto, não temos tanta
sorte e, por isso, acabamos experimentando
experiências desagradáveis.
• Por exemplo: Alguém poderia levantar a
hipótese de que crianças socialmente
isoladas assistem mais televisão do que
crianças bem integradas em seus grupos - e,
a partir daí, testa sua idéia através de
pesquisa sistemática.
1
2
4
0011 0010 1010 1101 0001 0100 1011
ALGUNS CONCEITOS
IMPORTANTES
1
2
4
POPULAÇÃO
0011 0010 1010 1101 0001 0100 1011
• População: é o conjunto de todos os
elementos dos quais desejamos pesquisar
alguma característica.
• Ex: Censo Demográfico.
1
2
4
POPULAÇÃO E AMOSTRA
0011 0010 1010 1101 0001 0100 1011
• Muitas vezes é impraticável para o
pesquisador observar todos os
elementos do grupo que pretende
estudar. É preciso, então, recorrer à
pesquisa com uma parte do todo.
1
2
4
POPULAÇÃO E AMOSTRA
0011 0010 1010 1101 0001 0100 1011
• Todos os elementos do grupo a ser
estudado constituem a população. A
parte da população efetivamente
examinada é a amostra.
1
2
4
AMOSTRA
0011 0010 1010 1101 0001 0100 1011
• Suponhamos uma pesquisa sobre o nível de
escolaridade de um grupo de oitocentas
pessoas. Nesse caso, a população é o
conjunto das oitocentas pessoas. Se
sentirmos desnecessário ou impossível
examinar os oitocentos elementos, podemos
recorrer a amostragem, ou seja, podemos
analisar parte desses elementos.
1
2
4
AMOSTRA
0011 0010 1010 1101 0001 0100 1011
• É claro que se escolhermos apenas dois
desses oitocentos elementos, corremos o
risco de selecionar exatamente dois
elementos com as mesmas características.
Se os dois forem analfabetos, por exemplo,
podemos concluir que todos os elementos
da população também o são.
1
2
4
AMOSTRA
0011 0010 1010 1101 0001 0100 1011
• Observe que, qualquer que seja a amostra,
sempre corremos o risco de chegar a
conclusões erradas, mas este risco diminui à
medida que aumenta a quantidade de
elementos a serem examinados.
1
2
4
AMOSTRA
0011 0010 1010 1101 0001 0100 1011
• Devemos estabelecer um mínimo de
elementos para compor a amostra. Essa
quantidade não deve ser menor que 10% do
total de elementos da população. Assim,
estaremos minimizando as chances de as
informações da amostra se afastarem
demasiadamente daquelas que obteríamos
se examinássemos toda a população.
1
2
4
AMOSTRA
0011 0010 1010 1101 0001 0100 1011
• Além de estabelecer um critério para a
quantidade de elementos que farão parte
da amostra, é importante estabelecer
critérios de seleção desses elementos.
1
2
4
0011 0010 1010 1101 0001 0100 1011
ALGUMAS FORMAS DE
AMOSTRAGEM
1
2
4
I) AMOSTRAGEM ALEATÓRIA SIMPLES:
0011 0010 1010 1101 0001 0100 1011
É o processo mais elementar e freqüentemente
utilizado. É equivalente a um sorteio
lotérico. Pode ser realizada numerando-se a
população de 1 a n e sorteando-se, a seguir,
por meio de um dispositivo aleatório
qualquer, x números dessa seqüência, os
quais corresponderão aos elementos
pertencentes à amostra.
1
2
4
Exemplo: Vamos obter uma amostra, de 10%,
representativa para a pesquisa da estatura de
0011 0010 1010 1101 0001 0100 1011
90 alunos de uma escola:
• 1º - numeramos os alunos de 1 a 90.
1
2
• 2º - escrevemos os números dos alunos, de
1 a 90, em pedaços iguais de papel,
colocamos na urna e após misturar
retiramos, um a um, nove números que
formarão a amostra.
4
II) AMOSTRAGEM PROPORCIONAL
ESTRATIFICADA:
0011 0010 1010 1101 0001 0100 1011
• Quando a população se divide em estratos
(subpopulações), convém que o sorteio dos
elementos da amostra leve em consideração
tais estratos, daí obtemos os elementos da
amostra proporcional ao número de
elementos desses estratos.
1
2
4
• Exemplo: Vamos obter uma amostra
proporcional estratificada, de 10%, do
exemplo anterior, supondo, que, dos 90
alunos, 54 sejam meninos e 36 sejam
meninas. São portanto dois estratos
(sexo masculino e sexo feminino).
0011 0010 1010 1101 0001 0100 1011
1
2
4
Logo, temos:
0011 0010 1010 1101 0001 0100 1011
sexo
masculino
feminino
total
população
54
36
90
10%
5,4
3,6
9,0
amostra
5
4
9
1
2
4
• Numeramos então os alunos de 01 a 90, sendo 01
a 54 meninos e 55 a 90, meninas e procedemos o
sorteio casual com urna ou tabela de números
aleatórios.
III) AMOSTRAGEM SISTEMÁTICA
0011 0010 1010 1101 0001 0100 1011
Quando os elementos da população já se
acham ordenados, não há necessidade de
construir o sitema de referência. São
exemplos os prontuários médicos de um
hospital, os prédios de uma rua, etc. Nestes
casos, a seleção dos elementos que
constituirão a amostra pode ser feita por um
sistema imposto pelo pesquisador.
1
2
4
• Exemplo: Suponhamos uma rua com 900 casas,
das quais desejamos obter uma amostra formada
0011 0010 1010 1101 0001 0100 1011
por 90 casas para uma pesquisa de opinião.
Podemos, neste caso, usar o seguinte
procedimento: como 900/90 = 10, escolhemos por
sorteio casual um número de 01 a 10, o qual
indicaria o primeiro elemento sorteado para a
amostra; os demais elementos seriam
periodicamente considerados de 10 em 10. Assim,
suponhamos que o número sorteado fosse 4 a
amostra seria: 4ª casa, 14ª casa, 24ª casa, 34ª casa,
44ª casa, etc.
1
2
4
VARIÁVEL
0011 0010 1010 1101 0001 0100 1011
Definição: É a característica a ser
estudada.
1
2
4
VARIÁVEL
0011 0010 1010 1101 0001 0100 1011
• Exemplo: A fim de ter um perfil de seu
“público”nos fins de semana, o proprietário
de um cinema contratou dois pesquisadores
para coletar dados referentes à sua clientela.
Os pesquisadores escolheram seis objetos
de estudo: sexo, idade, nível de
escolaridade, estado civil, renda mensal e
meio de transporte utilizado para chegar ao
cinema.
1
2
4
VARIÁVEL
0011 0010 1010 1101 0001 0100 1011
• Num fim de semana foram entrevistados 19
freqüentadores desse cinema. Os resultados
estão apresentados na tabela seguinte.
1
2
4
SEXO
IDADE
ESCOLARIDADE
ESTADO CIVIL
TRANSPORTE
RENDA (em S.M.)
Masculino
28
M
CASADO
CARRO
11,8
Masculino
38
M
CASADO
CARRO
13,9
Feminino
24
S
SOLTEIRA
CARRO
12,4
CASADO
CARRO
19,5
Masculino1010 1101430001 0100 1011
M
0011 0010
Feminino
32
S
SEPARADA
ÔNIBUS
12,1
Feminino
19
M
SOLTEIRA
A PÉ
5,0
Masculino
22
S
SOLTEIRO
ÔNIBUS
8,9
Masculino
25
M
SOLTEIRO
ÔNIBUS
13,3
Masculino
41
S
CASADO
A PÉ
Feminino
40
F
SOLTEIRA
CARRO
Feminino
35
S
SOLTEIRA
CARRO
Masculino
29
F
CASADO
Feminino
31
F
SOLTEIRA
Feminino
36
S
CASADA
Feminino
48
M
CASADA
Masculino
23
M
SOLTEIRO
Masculino
27
S
SOLTEIRO
Masculino
26
S
SEPARADO
Masculino
29
S
CASADO
1
2
4
CARRO
CARRO
CARRO
CARRO
A PÉ
14,7
16,6
9,3
11,6
10,2
16,0
18,8
15,4
A PÉ
10,7
ÔNIBUS
8,2
ÔNIBUS
12,5
VARIÁVEL
0011 0010 1010 1101 0001 0100 1011
• Algumas variáveis, como sexo, nível de
escolaridade, estado civil e transporte,
apresentam como resultado uma qualidade,
atributo ou preferência da pessoa
entrevistada. Variáveis dessa natureza
recebem o nome de variáveis qualitativas.
1
2
4
VARIÁVEL
0011 0010 1010 1101 0001 0100 1011
• Outras variáveis, como idade e renda mensal
apresentam como resposta um número, resultante
nesse exemplo de mensuração. Variáveis assim
definidas são chamadas variáveis quantitativas.
• Cabe ressaltar, que se os pesquisadores tivessem
perguntado: “Quantas vezes por semana você
costuma ir ao cinema?”, teríamos como objeto de
estudo uma variável quantitativa, cujos valores
assumidos são resultante de contagem.
1
2
4
VARIÁVEIS: QUADRO RESUMO
0011 0010 1010 1101 0001 0100 1011
VARIÁVEL
QUALITATIVA
QUANTITATIVA
DISCRETA
(contagem)
1
2
4
CONTÍNUA
(mensuração)
• Situação: A direção de um parque
contratou uma equipe de pesquisadores para
0011 0010 1010 1101 0001 0100 1011
coletar algumas informações sobre seus
freqüentadores. Os cem entrevistados
responderam às seguintes questões: sexo,
idade, quantas vezes por semana vão ao
parque, período de visita (manhã, tarde ou
noite), tempo de permanência e quantia
gasta nas dependências do parque. Cada um
desses objetos de estudo corresponde a uma
variável. Classifique as variáveis quanto ao
tipo.
1
2
4
RESOLUÇÃO DO PROBLEMA
0011 0010 1010 1101 0001 0100 1011
•
Variáveis qualitativas: sexo e período
de visita.
•
Variáveis quantitativas
I) Discreta: número de visitas por semana.
II) Contínuas: idade, tempo de
permanência e quantia gasta nas
dependências do parque.
1
2
4
SÉRIES ESTATÍSTICAS
0011 0010 1010 1101 0001 0100 1011
• SÉRIE ESTATÍSTICA: É qualquer tabela
que apresenta a distribuição de um conjunto
de dados estatísticos.
1
2
4
• TABELA: É um quadro que resume um
conjunto de dados dispostos segundo linhas
e colunas de maneira sistemática.
• De acordo com a Resolução 886 do IBGE, nas
casas ou células da tabela devemos colocar :
0011 0010
1010
1101 0001
0100 1011( - ) quando o valor é zero;
• um
traço
horizontal
• três pontos ( ... ) quando não temos os dados;
• zero ( 0 ) quando o valor é muito pequeno para
ser expresso pela unidade utilizada;
• um ponto de interrogação ( ? ) quando temos
dúvida quanto à exatidão de determinado valor.
• Obs: Os lados direito e esquerdo de uma tabela
oficial devem ser abertos. “Salientamos que em
alguns documentos as tabelas não são abertas
devido a limitações de editores como o html".
1
2
4
DISTRIBUIÇÃO DE FREQUÊNCIA
0011 0010 1010 1101 0001 0100 1011
• É um tipo de tabela que condensa uma
coleção de dados conforme as freqüências
(repetições de seus valores – número de
vezes que a variável é observada na
população estudada).
1
2
4
EXEMPLO:
0011 0010 1010 1101 0001 0100 1011
• Um repórter do jornal A Voz da Terra foi
destacado para acompanhar a apuração de
votos da eleição da diretoria do clube da
cidade, a qual concorrem os candidatos A,
B, C e D. O objetivo da pesquisa é a
publicação da porcentagem de votos obtidos
pelos candidatos.
1
2
4
Como organizar os dados?
0011 0010 1010 1101 0001 0100 1011
Os dados obtidos constituem os dados
brutos.
O repórter poderá recorrer a uma organização
numérica simples, registrada através de
símbolos de fácil visualização:
1
2
4
TABELA PRIMITIVA OU DADOS BRUTOS: É uma tabela ou
relação de elementos que não foram numericamente organizados
0011 0010 1010 1101 0001 0100 1011
Candidatos
A
B
C
D
Votos
1
2
4
ROL DOS DADOS: É a tabela obtida após a
ordenação dos dados (crescente ou decrescente).
0011 0010 1010 1101 0001 0100 1011
Candidatos
Votos
D
9
B
11
A
C
1
2
4
14
16
• Deste modo, ele terá iniciado o
0011 0010 1010trabalho
1101 0001 0100
de1011
tabulação dos dados.
Apesar das anotações do repórter
trazerem todas as informações sobre
estas eleições, é mais provável que seja
publicada uma tabela, com número de
votos de cada candidato e a respectiva
porcentagem de votos.
1
2
4
EXEMPLO DE DISTRIBUIÇÃO POR
FREQÜÊNCIA:
0011 0010 1010 1101 0001 0100 1011
Candidato
Votos (%)
D
Número de
votos
9
B
11
22
A
14
C
16
Total
50
18
1
2
4
28
32
100
• Na tabela do exemplo dado, a freqüência de
votos do candidato A é 9, a do candidato B
0011 0010 1010 1101 0001 0100 1011
é 11, a do C é 14 e a do D é 16. Estas
freqüências, representadas na segunda
coluna, são as freqüências absolutas (F).
Sua soma é igual a 50 que é o número total
de observações. Na coluna “% de votos”,
obtida a partir do cálculo de porcentagem de
votos de cada candidato, estão
representadas as freqüências relativas (Fr).
1
2
4
EXEMPLO 2:
0011 0010 1010 1101 0001 0100 1011
• DADOS BRUTOS: 45, 41, 42, 41, 42 43,
44, 41 ,50, 46, 50, 46, 60, 54, 52, 58, 57, 58,
60, 51
1
2
4
• ROL: 41, 41, 41, 42, 42 43, 44, 45 ,46, 46,
50, 50, 51, 52, 54, 57, 58, 58, 60, 60
Distribuição de freqüência:
Dados
41 0100 1011
0011 0010 1010 1101 0001
Freqüência
3
42
2
43
1
44
1
45
1
46
2
50
2
51
1
52
1
54
1
57
1
58
2
60
2
Total
20
1
2
4
Distribuição de frequência com intervalos de classe:
Quando o tamanho da amostra é elevado é mais racional
efetuar
o agrupamento
dos valores em vários intervalos de
0011 0010
1010 1101
0001 0100 1011
classe.
Classes
41 |----- 45
45 |----- 49
49 |----- 53
53 |----- 57
57 |----- 61
Total
Freqüência
7
3
4
1
5
20
1
2
4
Cálculo do número de classes :
0011 0010 1010 1101 0001 0100 1011
1
2
• Procurar no Google por: "Regra de
Sturges"
4
REPRESENTAÇÃO GRÁFICA
0011 0010 1010 1101 0001 0100 1011
• Dados estatísticos podem ser representados
tanto por tabelas quanto por gráficos.
1
2
4
CLASSIFICAÇÃO:
0011 0010 1010 1101 0001 0100 1011
• Diagramas;
• Pictogramas;
• Cartogramas.
1
2
4
Diagramas
0011 0010 1010 1101 0001 0100 1011
• São gráficos geométricos dispostos em
duas dimensões. São os mais usados na
representação de séries estatísticas.
1
2
4
I) Gráficos em barras horizontais
(gráfico de barras)
0011 0010 1010 1101 0001 0100 1011
• Para sua construção, as freqüências são
anotadas no eixo das abscissas, e os
valores da variável, no eixo das
ordenadas.
1
2
4
Gráficos em barras horizontais
0011 0010 1010 1101 0001 0100 1011
1
2
4
Gráficos em barras verticais
(gráfico de colunas)
0011 0010 1010 1101 0001 0100 1011
• Como o próprio nome indica, nesse tipo de
gráfico as freqüências serão representadas
por colunas – retângulos com bases de
mesma medida, cujas alturas correspondem
às freqüências.
1
2
4
Gráfico de colunas 3D
0011 0010 1010 1101 0001 0100 1011
1
2
4
Gráfico de setores (Pizza)
0011 0010 1010 1101 0001 0100 1011
• Este gráfico é construído com base em um círculo,
e é empregado sempre que desejamos ressaltar a
participação do dado no total. O total é
representado pelo círculo, que fica dividido em
tantos setores quantas são as partes. Os setores são
tais que suas áreas são respectivamente
proporcionais aos dados da série. O gráfico em
setores só deve ser empregado “quando há, no
máximo, sete dados”.
1
2
4
Gráfico de setores
0011 0010 1010 1101 0001 0100 1011
1
2
4
Gráficos de linhas (poligonal)
0011 0010 1010 1101 0001 0100 1011
• São frequentemente usados para
representação de séries cronológicas com
um grande número de períodos de tempo.
As linhas são mais eficientes do que as
colunas, quando existem intensas flutuações
nas séries ou quando há necessidade de se
representarem várias séries em um mesmo
gráfico.
1
2
4
Gráficos de linhas
0011 0010 1010 1101 0001 0100 1011
Taxas Brutas de Nupcialidade
Brasil, 1979-1994
1
Fonte: Fundação IBGE, Anuário Estatístico do Brasil 1960/1991 e 1994
2
4
II) PICTOGRAMAS
0011 0010 1010 1101 0001 0100 1011
• São construídos a partir de figuras
representativas da intensidade do fenômeno.
Este tipo de gráfico tem a vantagem de
despertar a atenção do público leigo, pois
sua forma é atraente e sugestiva. Os
símbolos devem ser auto-explicativos. A
desvantagem dos pictogramas é que apenas
mostram uma visão geral do fenômeno, e
não de detalhes minuciosos.
1
2
4
PICTOGRAMA
0011 0010 1010 1101 0001 0100 1011
1
2
4
III) CARTOGRAMAS
0011 0010 1010 1101 0001 0100 1011
• São ilustrações relativas a cartas geográficas
(mapas). O objetivo desse gráfico é o de
figurar os dados estatísticos diretamente
relacionados com áreas geográficas ou
políticas.
1
2
4
CARTOGRAMA
0011 0010 1010 1101 0001 0100 1011
1
2
4
CARTOGRAMA
0011 0010 1010 1101 0001 0100 1011
1
2
4
CARTOGRAMA
0011 0010 1010 1101 0001 0100 1011
1
2
4
MEDIDAS DE TENDÊNCIA CENTRAL
0011 0010 1010 1101 0001 0100 1011
• Pesquisadores em muitos campos tem usado
o termo “média” em questões tais como:
Quantos cigarros fuma, em média, o
adolescente? Qual a nota média de um
universitário? Em média, quantos são os
acidentes automobilísticos que resultam
diretamente da ingestão de álcool ou de
outras drogas?
1
2
4
• Uma forma útil de descrever um grupo
como
um
todo,
consiste
em
encontrar
um
0011 0010 1010 1101 0001 0100 1011
único número que represente o que é
“médio” ou “típico” naquele conjunto
particular de dados. Em pesquisa, tal valor é
conhecido como medida de tendência
central, uma vez que ela se localiza em
torno do meio ou centro de uma distribuição
– onde a maior parte dos dados tende a
concentrar-se.
1
2
4
MODA
0011 0010 1010 1101 0001 0100 1011
• É o valor que ocorre com maior freqüência em
uma série de valores.
• Mo é o símbolo da moda.
1
2
4
• Assim, o salário modal dos empregados de uma
fábrica é o salário mais comum, isto é, o salário
recebido pelo maior número de empregados dessa
fábrica.
• A moda é facilmente reconhecida: basta,
procurar o valor que mais se repete.
0011 0010 1010 1101 0001 0100 1011
Exemplo: Na série { 7 , 8 , 9 , 10 , 10 , 10 ,
11 , 12 } a moda é igual a 10.
1
2
• Há séries nas quais não existe valor
modal.
Exemplo: { 3 , 5 , 8 , 10 , 12 } não
apresenta moda.
Neste caso, a série é denominada amodal.
4
• Em outros casos, pode haver dois ou mais
0011 0010
1010 1101de
0001
0100 1011
valores
concentração.
Dizemos, então,
que a série tem dois ou mais valores
modais.
Exemplo: A série { 2 , 3 , 4 , 4 , 4 , 5 , 6 , 7 , 7
, 7 , 8 , 9 } apresenta duas modas: 4 e 7.
Portanto, ela é denominada série bimodal.
1
2
4
A MODA QUANDO OS DADOS
ESTÃO AGRUPADOS
0011 0010 1010 1101 0001 0100 1011
Uma vez agrupados os dados, é possível
determinar imediatamente a moda:
basta fixar o valor da variável de
maior freqüência.
1
2
4
I) Sem intervalos de classe
0011 0010 1010 1101 0001 0100 1011
Uma vez agrupados os dados, é possível
determinar imediatamente a moda:
basta fixar o valor da variável de maior
freqüência.
1
2
4
Exemplo: Qual é a moda das temperaturas
na tabela abaixo:
0011 0010 1010 1101 0001 0100 1011
temperatura freqüência
Oº C
3
1º C
9
2º C
12
3º C
6
1
2
4
• Resposta: 2º C é a
temperatura modal,
pois é a de maior
freqüência.
II) Com intervalos de classe
0011 0010 1010 1101 0001 0100 1011
• A classe que apresenta a maior freqüência é
denominada classe modal. Pela definição,
podemos afirmar que a moda, neste caso, é
o valor dominante que está compreendido
entre os limites da classe modal. O método
mais simples para o cálculo da moda
consiste em tomar o ponto médio da classe
modal. Damos a esse valor a denominação
de moda bruta.
1
2
4
Exemplo: Calcule a estatura modal
conforme
a
tabela
abaixo
.
0011 0010 1010 1101 0001 0100 1011
Classes
freqüência
(em cm)
54 |----- 58
9
58 |----- 62
11
62 |----- 66
8
66 |----- 70
5
Fórmula: Mo = (l + L) /2
Em que: l = limite inferior da
classe modal e L= limite
superior da classe modal.
A classe modal é 58|----- 62,
pois é a de maior
freqüência. l =58 e L=62
• Mo = (58+62) / 2 = 60 cm
( este valor é estimado,
pois não conhecemos o
valor real da moda).
1
2
4
MEDIANA
0011 0010 1010 1101 0001 0100 1011
• Quando dados são dispostos em ordem
crescente ou decrescente, torna-se possível
localizar a mediana (Md), que corresponde
ao ponto central da distribuição.
1
2
4
I) Se a série dada tiver número
ímpar de termos:
0011 0010 1010 1101 0001 0100 1011
• A mediana será o dado que cai exatamente no
meio da distribuição. A posição do valor mediano
pode ser determinada pelo exame dos dados ou
pela fórmula:
1
2
4
Posição da mediana = (n +1) /2
Em que n é o número de valores da distribuição.
Exemplo: Calcule a mediana da série
{ 1, 3, 0, 0, 2, 4, 1, 2, 5 }
0011 0010 1010 1101 0001 0100 1011
• ordenar a série { 0, 0, 1, 1, 2, 2, 3, 4, 5 }
1
2
• n = 9 , logo (n + 1)/2 é dado por
(9+1) / 2 = 5, ou seja, o 5º elemento da série
ordenada será a mediana
• A mediana é o 5º elemento = 2
4
II) Se a série dada tiver número
par de termos:
0011 0010 1010 1101 0001 0100 1011
• A mediana será sempre aquele ponto da
distribuição que é antecedido e precedido
por igual número de dados. Para uma
distribuição com número par de dados,
sempre há dois valores considerados
“centrais”. Assim, a mediana é a média
aritmética desses dois valores.
1
2
4
Exemplo: Calcule a mediana da série
{ 1, 3, 0, 0, 1, 4, 1, 3, 5, 6 }
0011 0010 1010 1101 0001 0100 1011
• Ordenar a série { 0, 0, 1, 1, 1, 3, 3, 4, 5, 6 }
• Os valores centrais são 1 e 3.
1
2
4
• E a mediana da série é: (1+3)/2=2
MÉDIA ARITMÉTICA
0011 0010 1010 1101 0001 0100 1011
• A medida de tendência central mais
comumente usada é a média aritmética, x ,
cujo cálculo consiste em somar um conjunto
de valores e dividir o total pelo número de
valores.
1
2
4
0011 0010 1010 1101 0001 0100 1011
Fórmula:
n
 xi
1
x1  x 2  x 3  ...  x n
x

n
n
i 1
2
4
• Exemplo: Calcular a média
aritmética
dos1011
elementos do
0011 0010
1010 1101 0001 0100
conjunto {2, 3, 8, 27}.
1
2  3  8  27
x
 10
4
2
4
MÉDIA ARITMÉTICA PONDERADA
0011 0010 1010 1101 0001 0100 1011
Exemplo:
1
2
Consideremos a distribuição relativa a 34
famílias de quatro filhos, tomando para
variável o número de filhos do sexo
masculino. Calcularemos a quantidade
média de meninos por família:
4
Quadro resumo:
0011 0010 1010 1101 0001 0100 1011
Número de meninos
0
Freqüência
(número de famílias)
2
1
6
2
3
4
total
1
2
4
10
12
4
34
• Como as freqüências são números
indicadores
da
intensidade
de
cada
valor
da
0011 0010 1010 1101 0001 0100 1011
variável, elas funcionam como fatores de
ponderação, o que nos leva a calcular a
média aritmética ponderada, dada pela
fórmula:
n
x
 x i . fi
i 1
n
 fi
i 1
1
2
4
x1. f1  x 2 . f 2  x 3 . f 3  ...  x n . f n

f1  f 2  f 3  ...  f n
Voltando à tabela para resolver o problema
proposto.
0011 0010 1010 1101 0001 0100 1011
xi
fi
xi . f i
0
1
2
3
4
total
2
6
10
12
4
34
0
6
20
36
16
78
1
• Média Aritmética
Ponderada:
2
4
78
x   2,3 meninos por família
34
• Exercício: (Unifesp) Para ser
aprovado
num
curso,
um
estudante
0011 0010 1010 1101 0001 0100 1011
precisa submeter-se a três provas
parciais durante o período letivo e uma
prova final, com pesos 1, 1, 2 e 3
respectivamente, e obter média no
mínimo igual a 7. Se um estudante
obteve nas provas parciais as notas 5, 7
e 5, respectivamente, a nota mínima
que necessita obter na prova final para
ser aprovado é:
1
2
4
Logo, a média aritmética ponderada será:
x 7
0011 0010 1010 1101 0001 0100 1011
1.5  1.7  2.5  3.n
7
11 2  3
22  3n
7
7
3n  27
n  9
1
2
4
MÉDIA ARITMÉTICA (EM
INTERVALOS DE CLASSE)
0011 0010 1010 1101 0001 0100 1011
• Neste caso, convencionamos que todos os
valores incluídos em um determinado intervalo
de classe coincidem com o seu ponto médio, e
determinamos a média aritmética ponderada
por meio da fórmula:
n
x
 x i . fi
i 1
n
 fi
i 1
1
2
4
x1. f1  x 2 . f 2  x 3 . f 3  ...  x n . f n

f1  f 2  f 3  ...  f n
• Em que xi é o ponto médio de cada classe.
Exemplo: Calcular a estatura média de
bebês conforme a tabela abaixo.
0011 0010 1010 1101 0001 0100 1011
estaturas
(cm)
freqüência ponto médio
( fi )
( xi )
xi . f i
50 |----- 54
4
52
208
54 |----- 58
9
56
504
58 |----- 62
11
60
660
62 |----- 66
8
64
512
66 |----- 70
5
68
340
70 |----- 74
3
72
216
Total
40
2440
• Aplicando a
fórmula
temos:
1
2
2.440 / 40 = 61
4
Logo,
x
= 61 cm
MÉDIA GEOMÉTRICA
0011 0010 1010 1101 0001 0100 1011
• Simples:
M G  n x1.x 2 .x 3 .....xn
• Ponderada: M Gp 
 fi
f1
f2
1
2
4
f3
x1 .x 2 .x 3 .....xn
fn
Exercício: Calcular a média
0011 0010 1010 1101 0001 0100 1011
geométrica dos elementos do
conjunto {2, 3, 8, 27}.
1
Podemos proceder da seguinte forma:
2
4
M G  2.3.8.27  2.2 .3.3  2 .3  2.3  6
4
4
3
3
4
4
4
MÉDIA HARMÔNICA
0011 0010 1010 1101 0001 0100 1011
DEFINIÇÃO:
É o inverso da média aritmética dos inversos.
FÓRMULA:
1
2
4
1
n
MH 

1 1 1
1 1 1 1
1
   ... 
   ... 
x1 x2 x3
xn x1 x2 x3
xn
n
MEDIDAS DE VARIABILIDADE
(MEDIDAS DE DISPERSÃO)
0011 0010 1010 1101 0001 0100 1011
• AMPLITUDE;
• VARIÂNCIA;
• DESVIO PADRÃO.
1
2
4
MEDIDAS DE DISPERSÃO:
INTRODUÇÃO
0011 0010 1010 1101 0001 0100 1011
• Vimos que a moda, a mediana e a média
podem ser usadas para resumir, num único
número, aquilo que é “médio” ou “típico”
numa distribuição. Quando empregada
sozinha, entretanto, qualquer medida de
tendência central fornece apenas uma visão
incompleta de um conjunto de dados,
portanto, pode distorcer tanto quanto
esclarecer.
1
2
4
ILUSTRANDO A SITUAÇÃO
COLOCADA:
0011 0010 1010 1101 0001 0100 1011
• Admita que em Honolulu (Havaí) e
Houston (Texas) tenham quase a mesma
temperatura média diária de 75º F. Será que,
por isso, podemos admitir que a temperatura
é basicamente a mesma em ambas as
localidades?
1
2
4
• A temperatura em Honolulu varia muito
ao0001
longo
do ano, oscilando, em geral,
0011 0010pouco
1010 1101
0100 1011
entre 70º F e 80º F. Por outro lado, a
temperatura em Houston pode diferir
estacionalmente, isto é, apresentar-se baixa
em janeiro – cerca de 40º F – e alta em
julho e agosto – próxima dos 100º F.
Desnecessário dizer, que as praias de
Houston não estão cheias de gente o ano
todo.
1
2
4
• Tal fato demonstra que necessitamos, além
de uma medida de tendência central, de um
0011 0010 1010 1101 0001 0100 1011
índice que indique o grau de dispersão dos
valores em torno do centro da distribuição.
Desta forma, precisamos de uma medida
indicativa que costumeiramente é chamada
variabilidade, variação ou ainda dispersão.
• Voltando ao exemplo, podemos dizer que a
distribuição de temperaturas em Houston tem
maior variabilidade (é mais dispersa) do que
a distribuição de temperaturas em Honolulu.
1
2
4
AMPLITUDE TOTAL
0011 0010 1010 1101 0001 0100 1011
• Pode-se obter uma medida de variabilidade
rápida, embora não muito exata, pelo
cálculo da amplitude total, que é a
diferença entre o maior e o menor valor da
distribuição.
1
2
4
EXEMPLO:
• Se a temperatura anual mais alta em
Honolulu foi de 88º F e a mais baixa, 62º F,
a amplitude total da temperatura foi de 26º
F (isto é, 88º F – 62º F = 26º F).
0011 0010 1010 1101 0001 0100 1011
1
2
• Se o dia mais quente em Houston apresenta
102º F e o mais frio, 33º F, a amplitude
total da temperatura anual em Houston foi
de 69º F (isto é, 102º F – 33º F = 69º F).
4
DESVANTAGEM DA UTILIZAÇÃO DA
AMPLITUDE COMO MEDIDA DE DISPERSÃO
0011 0010 1010 1101 0001 0100 1011
• A amplitude é inteiramente dependente de
apenas dois valores: o maior e o menor num
dado conjunto de valores. Como resultado,
a amplitude fornece, via de regra, um mero
índice grosseiro da variabilidade de uma
distribuição.
1
2
4
DESVIO PADRÃO
0011 0010 1010 1101 0001 0100 1011
• É a medida de dispersão que leva em
consideração a totalidade dos valores
da variável em estudo. É um indicador
de variabilidade bastante estável.
1
2
4
• DESVIO: d i  xi  x
2
2
2
2
d

d

d

...

d
2
1
2
3
n


• VARIÂNCIA:
n
0011 0010 1010 1101 0001 0100 1011
• DESVIO PADRÃO:
d  d  d  ...  d

n
2
1
2
2
2
3
2
n
1
2
4
Exercício: A distribuição das freqüências das alturas
dos jogadores de futebol está mostrada na tabela a
seguir:
0011 0010
1010 1101 0001 0100 1011
Altura (m)
Número de jogadores
1,65 |----- 1,75
2
1,75 |----- 1,85
1,85 |----- 1,95
1,95 |----- 2,05
1
2
4
6
8
4
b) Calcule a média e o desvio padrão dessa
distribuição
de
freqüência.
0011 0010 1010 1101 0001 0100 1011
 Cálculo da média aritmética:
Primeiro devemos calcular o ponto médio de cada
intervalo de classe e em seguida fazemos uso
desses valores para calcular a média aritmética.
1
2
4
2 . 1,70  6 . 1,80  8 . 1,90  4 . 2,00
x
 1,87
20
Cálculo dos desvios:
d1  1,70  1,87  0,17
0011 0010 1010 1101 0001 0100 1011
d 2  1,80  1,87  0,07
d3  1,90  1,87  0,03
d 4  2,00  1,87  0,13
1
2
4
Cálculo da variância:
0011 0010 1010 1101 0001 0100 1011
2
2
2
2
2.
(-017
)

6
.(-0,07)

8.
(0,03)

4.(0,13)
2 
 0,0081
20
1
Cálculo do desvio padrão:
  0,0081  0,09
2
4
SIGNIFICADO DO DESVIO PADRÃO
0011 0010 1010 1101 0001 0100 1011
• Após calcular o desvio padrão de uma de
uma série o sujeito pode ficar com uma
desagradável sensação relacionada com o
significado do resultado.
• O que indica esse número? O que,
exatamente, podemos dizer agora a respeito
dessa distribuição que não poderíamos ter
dito antes?
1
2
4
Tornando a noção de desvio padrão
mais
clara:
uma
ilustração.
0011 0010 1010 1101 0001 0100 1011
• Uma importante característica da
curva normal é auxiliar na
interpretação e compreensão do desvio
padrão.
1
2
4
Curva normal
0011 0010 1010 1101 0001 0100 1011
• A curva normal é um tipo de curva
simétrica, suave, cuja forma lembra um
sino.
• O aspecto mais marcante dessa curva é a
simetria.
• O ponto de freqüência máxima dessa curva
está situado no meio da distribuição, em que
a média, a mediana e a moda coincidem.
1
2
4
Curva normal
0011 0010 1010 1101 0001 0100 1011
1
2
4
Área sob a curva normal
0011 0010 1010 1101 0001 0100 1011
1
2
4
Área sob a curva normal
0011 0010 1010 1101 0001 0100 1011
1
2
4
Área sob a curva normal
0011 0010 1010 1101 0001 0100 1011
1
2
4
0011 0010 1010 1101 0001 0100 1011
• Podemos concluir, então, que a área
total sob a curva normal compreendida
entre  3 e  3 , inclui para
efeitos práticos, a totalidade dos dados
sob qualquer curva normal (mais de
99%).
1
2
4
SITUAÇÃO: Para entendermos melhor essa
característica, vamos examinar o que alguns
antropólogos
0011 0010
1010 1101 0001 dizem
0100 1011a respeito da diferença de
QIs ligadas ao sexo.
1
2
• Alguns pesquisadores afirmam que homens
e mulheres têm QI médio igual a 100.
Entretanto, esses QIs diferem
acentuadamente em termos de variabilidade
em torno da média.
4
• A distribuição do QIs masculinos
contém
porcentagem maior de
0011 0010 1010
1101 0001uma
0100 1011
valores extremos – representativos de
sujeitos brilhantes e de sujeitos
medíocres – enquanto que a
distribuição de QIs femininos contém
uma porcentagem maior de valores
localizados próximos à média.
1
2
4
• Em virtude do desvio padrão ser uma
medida de variabilidade, essas diferenças
ligadas ao sexo deveriam refletir no valor
do desvio padrão de cada distribuição de
QIs. Poderíamos, assim, verificar, por
exemplo, que   10 para os indivíduos do
sexo masculino e que   5 para os
indivíduos do sexo feminino.
0011 0010 1010 1101 0001 0100 1011
1
2
4
• Se conhecêssemos o desvio de cada
conjunto
de valores de QI e
0011 0010 1010 1101
0001 0100 1011
admitíssemos que cada conjunto
tivesse distribuição normal,
poderíamos estimar e, em seguida,
comparar as porcentagens de
indivíduos do sexo masculino e
indivíduos do sexo feminino
localizadas numa dada amplitude de
QIs.
1
2
4
Distribuição de QIs masculinos
0011 0010 1010 1101 0001 0100 1011
1
2
4
Distribuição de QIs femininos
0011 0010 1010 1101 0001 0100 1011
1
2
4
CONCLUSÕES
0011 0010 1010 1101 0001 0100 1011
• O desvio padrão e a curva normal nos
permite comparar os QIs femininos e
masculinos ao longo de toda a
distribuição.
1
2
4
• Por exemplo: se medirmos a linha base
da
distribuição
de QIs masculinos em
0011 0010
1010
1101 0001 0100 1011
unidades de desvio padrão, ficaremos
sabendo que 68,25% dos valores caem
entre -1sigma e + 1sigma. Desse
modo, 68,25% dos representantes do
sexo masculino terão, nas condições
propostas QIs entre 90 e 110.
1
2
4
RESOLUÇÃO DOS EXERCÍCIOS DA
APOSTILA DO ANGLO
0011 0010 1010 1101 0001 0100 1011
AULAS 18 E 19 - ESTATÍSTICA
SETOR 1102
PÁGINA 19
1
2
4
Exercício 1: Uma prova de matemática constou de 20 testes
apresentando a seguinte distribuição por assunto:
0011 0010 1010 1101 0001 0100 1011
ASSUNTO
FREQUÊNCIA
Geometria
6
Álgebra
8
Aritmética
4
Cálculo
2
TOTAL
20
PORCENTAGEM
1
2
4
a) Complete a coluna de porcentagem.
b) Represente estes dados num gráfico de barras verticais.
Exercício 1: Resolução (item a)
0011 0010 1010 1101 0001 0100 10116
Geometria :
20
 0,3  30%
8
Álgebra :
 0,4  40%
20
4
Aritmética :
 0,2  20%
20
2
Cálculo :
 0,1  10%
20
1
2
4
Exercício 1: Resolução (item a – continuação)
0011 0010 1010 1101 0001 0100 1011
ASSUNTO
FREQUÊNCIA
PORCENTAGEM
Geometria
6
30%
Álgebra
8
Aritmética
4
Cálculo
2
TOTAL
20
1
40%
2
4
20%
10%
100%
Exercício 1: Resolução (item b)
0011 0010 1010 1101 0001 0100 1011
1
2
4
Exercício 2: Nas aulas de Educação Física de
um colégio são praticados três esportes:
0011 0010 1010 1101 0001 0100 1011
vôlei, futebol e basquete. Cada um dos 300
alunos opta por um único esporte. Sabendo
que 75 alunos escolheram futebol,
responda:
1
2
4
Exercício 2:
a) Quanto mede em graus o ângulo do setor circular
0011 0010que
1010corresponde
1101 0001 0100ao
1011
número de alunos que
optaram por futebol?
300  360o
75  x
75 . 360o
x 
 x  90o
300
1
2
4
Exercício 2:
b) Quantos alunos optaram por basquete, se o
0011 0010ângulo
1010 1101
0100
1011
do0001
setor
circular
correspondente aos
alunos que escolheram vôlei mede 120º.
futebol vôlei basquete 360o
90o  120o    360o    150o
300  360o
x  150o
Assim, x  125
1
2
4
Exercício 3: Foram perguntadas as idades dos 10
primeiros alunos matriculados num determinado
curso noturno e obteve-se a seguinte seqüência de
0011 0010
1010 1101 0001 0100 1011
idades:
17, 20, 19, 18, 21, 16, 18, 21, 21, 19
Pede-se, obter:
a) Idade média
b) Mediana (Md)
c) Moda (Mo)
d) Variância (σ2)
e) Desvio padrão (σ)
1
2
4
Exercício 3
a) Idade média: Resposta
0011 0010 1010 1101 0001 0100 1011
Ordenando,temos : (16,17,18,18,19,19, 20, 21, 21, 21)
16  17  2.18  2.19  20  3.21
x
10
x  19
1
2
4
Exercício 3
b) Mediana:
Resposta
0011 0010
1010 1101 0001
0100 1011
Ordenando,temos : (16,17,18,18,19,19, 20, 21, 21, 21)
Média dos termos centrais :
Md 
19  19
2
Md  19
1
2
4
Exercício 3
c) Moda:
Resposta
0011 0010
1010 1101
0001 0100 1011
1
2
Ordenando,temos : (16,17,18,18,19,19, 20, 21, 21, 21)
valor que aparece com maior frequência :
Mo  21
4
Exercício 3
d) Variância: Resposta
0011 0010 1010 1101 0001 0100 1011
2
2
2
2
2
2
(
16

19
)

(
17

19
)

2
.(
18

19
)

2
.(
19

19
)

(
20

19
)

3
.(
21

19
)
2 
10
2 
28
10
 2  2,8
1
2
4
Exercício 3
e) Desvio padrão: Resposta
0011 0010 1010 1101 0001 0100 1011
  2,8
2
  2,8
  1,67
1
2
4
Exercício 4: Dois estudantes, A e B, obtiveram as
notas abaixo relativas aos quatro bimestres escolares.
0011 0010 1010 1101 0001 0100 1011
A
B
6
6
4
6
5
4
5
4
1
a) Calcule a média das notas de cada aluno.
2
4
b) Qual aluno teve uma atuação mais regular?
Exercício 4
a) 1010
Resposta
0011 0010
1101 0001 0100 1011
6 455
xA 
5
4
6644
xB 
5
4
1
2
4
Exercício 4
b) Resposta
2
2
2
0011 0010 1010
1101
000120100 1011
2 (6  5)  (4  5)  (5  5)  (5  5)
A 
4
 A2 
2
2
 A 
4
2
(6  5) 2  (6  5) 2  (4  5) 2  (4  5) 2
B 
4
2
 B2 
4
 B 1
4
Como  A   B , o estudanteA teve atuação mais regular.
1
2
4
REFERÊNCIAS BIBLIOGRÁFICAS
0011 0010 1010 1101 0001 0100 1011
• LEVIN, J. Estatística Aplicada a Ciências
Humanas, 2ª edição. Trad. Sérgio
Francisco Costa. USA: Editora Harbra,
1987.
1
2
4
• NAZARETH, H. Curso Básico de
Estatística. São Paulo: Ática, 1994.