estatistica-aula_2-_centro_e_dispersao

Download Report

Transcript estatistica-aula_2-_centro_e_dispersao

MBA em Gestão de
Empreendimentos Turísticos
Estatística Aplicada ao Turismo
PROF. DR. OSIRIS MARQUES
Aula 2
Medidas descritivas nas
séries turísticas
Medidas Descritivas nas
Séries Turísticas
Medidas de Posição
• Aritmética
• Médias
• Geométrica
• Harmônica
Medidas de
Posição
• Mediana
• Moda
• Quartis e Percentis
Medidas de Posição: Análise das
Médias
Média Aritmética
A média aritmética da amostra corresponde
à soma dos valores, divida pelo número de
valores.
n
x1  x2  ...  xn
x

n
Onde:
xi são os valores das variáveis
n é o número total de elementos de xi
x é a média aritmética da amostra
x
i 1
n
i
x


i
n
Medidas de Posição: Análise
das Médias
Média Aritmética: dados agrupados (tab. frequência)
Exemplo: Um veículo convencional pode ser ocupado por, no
mínimo, uma pessoa e por, no máximo, cinco. Uma empresa de
locação de veículos coletou a ocupação de seus veículos alugados,
durante o verão passado, conforme a tabela apresentada. Qual foi a
ocupação média dos carros?
Xi
ni
Xi x ni
1
2
3
4
5
10
15
20
50
5
100
10
30
60
200
25
325
k
 Xn
i
X
i 1
N
i
325

 3,25
100
A média dada significa que a
ocupação média dos carros foi
de aproximadamente 3 pessoas.
Medidas de Posição: Análise
das Médias
Média Aritmética: dados agrupados (tab. frequência)
Exemplo: O gasto por turista nas Ilhas Baleares foi coletado por
níveis de gasto na tabela. Qual o gasto médio por turista?
L i -1 - Li
Xi
3.000 - 4.500
4.500 - 6.000
6.000 - 7.500
7.500 - 8.500
8.500 -12.500
12.500 - 20.000
3.750
5.250
6.750
8.000
10.500
16.250
ni
125
185
245
212
155
78
1.000
Xi x ni
468.750
971.250
1.653.750
1.696.000
1.627.500
1.267.500
7.684.750
k
 Xn
i
X
i 1
N
i

7.648.750
 7.684,75
1.000
Li  Li  1
Xi 
2
A média indica que o gasto
médio por turista no destino
foi de 7.684,75 unidades
monetárias
Medidas de Posição: Análise
das Médias
Média Geométrica
A média geométrica mede a taxa de variação de uma variável
Média Geométrica da taxa de retorno
Onde Ri corresponde à taxa de retorno no período i e RG o
percentual médio de retorno de uma determinada variável
Medidas de Posição: Análise
das Médias
Média Geométrica
Exemplo: Os aumentos salariais do subsetor hoteleiro para os últimos anos
foram os apresentados na tabela. Qual foi o crescimento médio dos salários
durante esses 5 anos?
ANO
1994
1995
1996
1997
1998
AUMENTO SALARIAL (%)
12%
10%
7%
6%
5%
Ou seja, o crescimento médio dos últimos 5 anos foi de 5% ao ano.
Medidas de Posição: Mediana e
Moda
Mediana
Mediana é uma medida muito usada quando os dados estão em
escala ordinal ou quando existem valores extremos que afetam o
cálculo da média. Nesses casos, a mediana é mais representativa. A
Mediana é o valor do meio em um conjunto de dados que tenha
sido ordenado do menor para o maior. Valores extremos não afetam
a mediana.
• Se a quantidade de observações é ímpar, a mediana é o valor
central.
• Se a quantidade de observações é par, considera-se como
mediana a média dos dois valores centrais
, se n é ímpar;
Md (X) =
, se n é par.
Medidas de Posição: Mediana e
Moda
Moda
A Moda é o valor que se apresenta com maior frequência
num conjunto de dados. Podem haver uma ou mais modas,
ou pode mesmo não existir a moda. Do mesmo modo que a
mediana, e diferentemente da média aritmética, valores
extremos não afetam a moda.
Xi
ni
Ni
20
21
22
23
24
3
3
2
1
1
10
3
6
8
9
10
Qual a mediana e a
moda para os dados
da tabela a seguir?
Md = 21
Mo = 20 e 21
Medidas de Dispersão
• O valor da média apresenta a distribuição de
frequência de uma forma sintética, mas essa
informação não permite saber quão dispersa é a série
estudada em relação ao valor central (a média)
• As principais medidas de dispersão que veremos
são:
– Amplitude;
– distância inter-quartil;
– Variância;
– desvio padrão;
– coeficiente de variação.
Medidas de Dispersão
Amplitude
É a diferença entre o valor máximo e o valor mínimo da distribuição.
Am = Xmáx - Xmín
Exemplo: O número de visitantes que passaram por dois museus
distintos durante três dias é conhecido pela tabela dada. Qual dos dois
museus apresenta maior dispersão do número de visitantes?
Museu 1 Xi
Museu 2 Xi
190
200
210
10
200
390
X  200
A1= Xmáx – Xmín = 210 - 190 = 20
A2= Xmáx – Xmín = 390 – 10 = 380
Portanto, o segundo museu apresenta
maior dispersão dos valores.
Medidas de Dispersão
Distância inter-quartil
• Os Quartis dividem um conjunto de dados em
quatro partes iguais.
• A Distância inter-quartil – é a diferença entre o
3º e o 1º quartis, Q3 - Q1.
• No intervalo que vai de Q1 a Q3 encontram-se
50% das observações (as mais centrais).
Medidas de Dispersão
Variância
A variância da amostra é a soma das
diferenças da média aritmética elevadas ao
quadrado, divida pelo tamanho da amostra
menos 1.
Medidas de Dispersão
Devio-pardrão
A variância não vem representada na mesma
unidade das observações. Se tomarmos a raiz
quadrada da variância obtemos o desvio
padrão que também é uma medida de
dispersão e vem na mesma unidade das
observações.
n
S  S2 
2
(
X

X
)
 i
i 1
n 1
Medidas de Dispersão
Variância e Devio-pardrão
Para calcular, manualmente, a variância e o
desvio-padrão da amostra:
Etapa 1: Calcule a diferença entre cada valor e a
média aritmética
Etapa 2: Eleve ao quadrado cada difernça
Etapa 3: Some as difernças elevadas ao quadrado;
Etapa 4: Divida esse total por n-1 para obter a
variância da amostra;
Etapa 5: Calcule a raiz quadrada da variância para
obter o desvio-padrão da amostra
Medidas de Dispersão
Variância e Devio-pardrão
Exemplo: A tabela a seguir ilustra o cálculo da variância e do desviopadrão para os retornos anuais de três anos dos fundos de baixo capital
Retorno Anual
de três anos
20,80
26,00
24,90
29,90
22,30
19,00
22,40
Média (X) =
23,6143
Etapa 1
Etapa 2
(Xi  X )
(Xi X)2
-2,8143
2,3857
1,2857
6,2857
-1,3143
-4,6143
-1,2143
7,9203
5,6916
1,6530
39,5100
1,7274
21,2918
1,4745
Etapa 4 (÷ n-1)
Etapa 3
S =7
9
,
2686
13,2114
Medidas de Dispersão
Variância e Devio-pardrão
Exemplo: A tabela a seguir ilustra o cálculo da variância e do desviopadrão para os retornos anuais de três anos dos fundos de baixo capital
n
S 
2
2
(
X

X
)
 i
i 1
n 1
Variância
79,2686

 13,2114
6
S  S  13,2114  3,635
2
Desvio-padrão
Medidas de Dispersão
Coeficiente de variação
Diferentemente das medidas de variação anteriormente
apresentadas, o coeficiente de variação é uma medida
relativa de variação que é sempre expressa sob a forma de
percentagem, e não em termos das unidades dos dados
específicos. O coeficiente de variação (C) mede a
dispersão dos dados em relação à média.
S
CV  100 %
X
O coeficiente de variação é muito útil quando se
comparam dois ou mais conjuntos de dados
mensurados em unidades de medidas diferentes.