Apostila - pospaulasouza.com.br

Download Report

Transcript Apostila - pospaulasouza.com.br

MBA em Gestão de Projetos e
Processos Organizacionais
Estatística Aplicada
Galo Lopez Noriega
[email protected]
1
Estatística Aplicada
Medidas Descritivas
Bussab e Morettin: Capítulo 3
Freedman: Capítulo 4
Levine: Capítulo 3
2
Medidas descritivas
Falaremos de:
 Medidas de posição
 medidas de tendência central = valor
típico (média, moda, mediana)
 quantis / percentis
 Medidas de dispersão
variância, desvio padrão)
(amplitude,
 Medida de assimetria
3
Medidas de Tendência
Central ou de Posição
4
Medidas de tendência central
As medidas de posição (tendência central ou locação) são
valores calculados com o objetivo de representar os
dados de uma forma ainda mais condensada do que
usando uma tabela.
Quando o desejo é representar, por meio de um único
valor, determinado conjunto de informações que variam,
parece razoável escolher um valor central, mesmo que
este valor seja uma abstração. Na prática, essas medidas
estão relacionadas a dados quantitativos.
5
Exemplo
A gerente comercial de uma editora deseja
estudar o preço de venda de um livro de historias
infantis em 2 municípios: A e B.
Para estudar a distribuição de preços, foram
tomados os preços praticados por uma amostra
de 25 lojas do município A e de 20 lojas do
município B.
6
Dados
Município
A
14,80
18,20
13,60
15,50
12,00
13,70
16,00
17,30
14,40
16,10
26,80
12,10
B
12,90
20,90
19,30
14,40
15,10
13,10
15,50
14,30
15,10
15,80
13,00
14,90
17,00
21,30
20,70
20,70
19,90
20,30
21,10
19,60
19,30
20,80
19,70
20,30
19,60
19,20
18,50
18,60
20,30
20,10
19,90
21,00
18,90
7
Ramo-e-folhas - Comparação
12
13
14
Município A
15
16
17
18
19
20
21
22
23
24
25
26
00
60
80
50
00
30
20
30
90
80
10
70
40
10
10
00
90
10 00
40 30 90
50 10 80
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
Município B
50
90
70
30
60
60
70
10
90
30 70 60 20 90
30 80 30 30 10
00
8
Histograma - Comparação
Histogram a - Município B
0.50
0.5
0.40
0.4
Densidade
Densidade
Histogram a - Município A
0.30
0.20
0.10
0.3
0.2
0.1
0.00
0
12 --| 13
13 --| 14
14 --| 15
15 --| 16
16 --| 17
17 --| 18
18 --| 19
19 --| 20
20 --| 21
21 --| 22
22 --| 23
23 --| 24
24 --| 25
25 --| 26
26 --| 27
12 --| 13
13 --| 14
14 --| 15
15 --| 16
Preço em R$
assimétrica
17 --| 18
18 --| 19
19 --| 20
20 --| 21
21 --| 22
22 --| 23
23 --| 24
24 --| 25
25 --| 26
26 --| 27
Preço em R$
Análise
• Distribuição
preços;
16 --| 17
Análise
de
• Distribuição pouco assimétrica;
• Grande variabilidade;
• Pequena
preços;
• Preço típico entre 13 e 16;
• Preço típico entre 19 e 21;
• Presença de um valor aberrante.
• Não há valores aberrantes. 9
variabilidade
de
Notação
Amostra de n observações da variável X:
x1, x2, ..., xn
Amostra ordenada de n observações da variável X:
x(1)  x(2)  ...  x(n)
Mínimo = x(1)
Máximo = x(n)
Medidas de tendência central
Média Aritmética ou simplesmente média representa o valor
“provável” de uma variável, por isso, é também chamada
de valor esperado ou esperança matemática, quando
calculada para a população.
10
Média Aritmética
n
x
x
i
i1
n
Valores aberrantes
Assimetrias
11
Medidas de tendência central
Mediana: valor que divide um conjunto de dados ordenados
ao meio. Em outras palavras, é um valor tal que tenha
igual quantidade de valores menores e maiores do que
ele.
Uma característica importante da mediana é que ela não é
afetada por dados extremos, como acontece com a média.
Moda: valor que ocorre com a maior freqüência
12
Mediana
x n ; se n é ímpar
 2
md(X)   x n   x n 1
2
2
; se n é par

2

13
Moda
mo(X) = Observação mais freqüente
densidade de frequência
Para
variáveis
contínuas =
0,07
0,06
0,05
0,04
0,03
0,02
0,01
0
20000
30000
40000
50000
60000
70000
Salário
mo(X)
14
Exemplo: o número de computadores
escritórios de uma determinada empresa é
n de computadores:
3
6
1
3
4
Média:
3  6 1 3  4  3  5
X
 3,6
7
Mediana:
1
3
3
50%
3
Mediana
4
5
em
7
3
5
6
50%
Moda = 3
15
Medidas de Tendência Central
Município A
Medida
Município B
Com
26,80
Sem
26,80
Média
15,67
15,21
19,90
Mediana
15,10
15,00
20,00
Moda
14,4; 15,1 14,4; 15,1
e 15,5
e 15,5
20,30
16
Percentil ou Quantil
17
Percentis ou quantis
Amostra ordenada
p% menores
observações
(100-p)% maiores
observações
q(p)
 p 
i
.n
 100 
Quantil ou Percentil de ordem p (0<p<1): é o
valor que divide o conjunto de dados ordenado em
2 partes: uma delas com p% dos menores valores
e a outra com (100-p)% dos maiores valores.
18
Percentis ou quantis
A empresa ABC oferece um emprego com salário de
R$8.100,00 a Evandro. Para avaliar essa oferta, Evandro
compra um jornal onde publica-se os valores dos salários
de sua profissão conforme a tabela a seguir:
Percentil Salário ($)
10%
1500
25%
2000
50%
3000
75%
4500
90%
8000
Evandro descobriu, observando a
tabela do jornal, que a empresa ABC
corresponde ao grupo dos 10% das
empresas que melhor remuneram
sua profissão.
19
Quartis
Amostra ordenada
25%
menores
observações
50% - observações
centrais
q(0,25)
md=q(0,50)
q(0,25)= Q1: primeiro quartil
q(0,50)= Q2: segundo quartil (mediana)
q(0,75)= Q3: terceiro quartil
25% maiores
observações
q(0,75)
Intervalo Interquartil
IQ  q(0,75)  q(0,25)
20
Quartis e Percentis
Quartil: são valores que dividem o conjunto de dados
ordenados em quatro partes iguais. Cada parte
contendo 25% dos dados.
2210
2255
2350
25%
2380
2390
25%
Q1 = 2372,5
Percentis
P25 = Q1
 25 
i25  
12  3 posição
 100 
2350  2380
 2365
2
2420
2440
Q2 = 2430
2450
25%
2550
2630
Q3 = 2570
2825 2900
25%
(mediana)
P50 = Mediana
 50 
i50  
12  6 posição
 100 
2420  2440
 2430
2
P75 = Q3
 75 
i75  
12  9 posição
 100 
2550  2630
 2590
2
21
Percentis & Quartis
Medida
Município A Município B
Mínimo
12,00
18,45
Q1
13,70
19,53
Mediana
15,10
20,00
Q3
16,10
20,70
Máximo
26,80
21,30
IQ
2,40
1,25
22
Box-Plot
O box-plot é uma figura que possibilita visualizar
várias características de um conjunto de dados
como:
• as de tendência central (mediana)
• de posição (primeiro quartil e terceiro quartil)
• de dispersão (intervalo entre quartis)
• de assimetria
• pode identificar os valores considerados como
extremos.
23
Abrir arquivo boxplot
Box-Plot
Caixa que contém 50% das observações
centradas. Parte superior é Q3 e o inferior é Q1.
Mediana Q2 está dentro da caixa.
 IQ = Q3 - Q1
 Limite Superior = Q3 + 1.5 IQ
 Limite Inferior = Q1 - 1.5 IQ
 Ponto Extremo ou aberrante (“outlier”) - acima do
L.S. ou abaixo do L.I.
24
Link – Box-plot
http://www.mis.coventry.ac.uk/~nhunt//boxplot.html
27.00
22.00
17.00
Q1
< LI
12.00
Q2
> LS
Q3
7.00
2.00
-3.00
A
B
http://www.de9.ime.eb.br/~aderson/boxplot.pdf
25
Abrir arquivo boxplot
Valores aberrantes?
Pontos com comportamento diferente
observado para a maioria dos dados.
do
Pontos distantes da massa dos dados.
Pontos desajustados.
26
Causas de valores aberrantes
Erros de medida (transcrição/ digitação).
Unidade amostral não pertence à população
em estudo.
Ocorrência de evento extraordinário com
explicação científica (variabilidade natural dos
dados).
27
O que fazer com valores
aberrantes?
Depende de como foi gerado.
Retirar da amostra se for fruto de erros de medida,
de transcrição/ digitação ou se a unidade
amostral não pertence à população em estudo.
Considerar na análise se for fruto da variabilidade
natural dos dados; nesse caso adotar técnicas
robustas de análise ou fazer a análise com e
sem o valor.
28
Valores Aberrantes Unidimensionais
Gráfico de caixas
0
5
10
6 7 8 9
15
Histograma
6
7
8
9
1 0
a l1
0
5
10
4 5 6 7
15
Av
4
5
6
Av
7
a l1
29
Atenção para distribuições
assimétricas
Gráfico de Caixas
0 10 20 30 40 50 60
Valores
aberrantes ou
conseqüência da
assimetria?
0
0 10 20 30
Histograma
1 0 0
2 0 0
3 0 0
4 0 0
Av
a l2
30
Medidas de Dispersão
31
Medidas de Dispersão
A distribuidora Mesquita e Freitas faz pedido de livros regularmente
para dois fornecedores (A e B). Os dois fornecedores dizem que
necessitam de 10 dias, em média, para entregar os pedidos.
Atualmente, o diretor de compras da M&F faz pedidos iguais aos dois
fornecedores mas gostaria de aumentar o pedido para um deles. O
histograma do tempo de entrega dos dois fornecedores encontramse abaixo:
Fornecedor B
0.6
0.35
0.5
0.3
Densidade
Densidade
Fornecedor A
0.4
0.3
0.2
0.25
0.2
0.15
0.1
0.1
0.05
0
0
7
8
9
10
11
dias
12
13
14
15
7
8
9
10
11
12
13
14
15
dias
32
Medidas de dispersão
Fornecedor B
0.6
0.35
0.5
0.3
Densidade
Densidade
Fornecedor A
0.4
0.3
0.2
0.1
0.25
0.2
0.15
0.1
0.05
0
0
7
8
9
10
11
dias
12
13
14
15
7
8
9
10
11
12
13
14
15
dias
O tempo médio de entrega dos 2 fornecedores parece o
mesmo mas os valores do tempo de entrega do fornecedor B
estão mais dispersos em relação ao tempo médio de entrega
(isto é equivalente a dizer que os tempos de entrega do
fornecedor A estão mais concentrados em relação ao tempo
médio de entrega)
33
Medidas de dispersão
Amplitude:
  x (n) - x (1)
Município controle:  = 26,80 - 12,00= 14,80
Município controle sem a maior observação:
 = 20,90 - 12,00= 8,90
Características
• simples;
• muito afetada por outliers;
• não considera a distribuição dos dados.
34
Coeficientes baseados em
distâncias a uma medida de
tendência central
Baixa variabilidade
Alta variabilidade
As observações
estão próximas á
medida de tendência
central
As observações
estão mais distantes
da medida de
tendência central 35
Desvio médio absoluto
n
dm(X) 
x
i1
i
x
n
Município A (sem 26,80)
dm(X)=2,11
dm(X)=1,63
Município B
dm(Y)=0,67
Município A (amostra completa)
36
Variância
n
var(X)  S 
2
n
 x  x 
i1
n
2
i
n -1

x
i1
2
i
 nx
2
n -1
Município A
Município A (sem 26,80)
var(X)=S2n= 9,93
var(X)= S2n =4,76
Município B
var(Y) =0,67
37
Medidas de dispersão
Variância:
 A variância da amostra é a média das diferenças ao
quadrado entre cada uma das observações e a média do
conjunto.
 Um dos problemas de usar a variância como medida de
dispersão é o fato de sua unidade não ser a mesma unidade
em que a variável foi medida (os valores dos dados estão
elevados ao quadrado). A solução é extrair a raiz quadrada
positiva da variância, já que, com isso, se volta à unidade
original da variável.
38
Desvio padrão
n
dp(X)  Sn 
 x
i1
 x
2
i
n -1
Município A
dp(A) = Sn= 3,15
dp(A) = Sn= 2,18
Município B
dp(B) = 0,82
Município A
39
Medidas de Dispersão
22
23
25
27
25%
Q1 = 26
30
25%
32
36
25%
Q2 = 33,5
(mediana)
R = 41 – 22 = 19
DM 
35
36
37
38 41
25%
Q3 = 36,50
IQ = 36,50– 26 = 10,50
22  31,8  23  31,8  ....  41  31,8
12
 5,36
40
Medidas de Dispersão
22
23
25
27
30
32

22  31,8   23  31,8

2
s
2
35
2
12 - 1
36
36
37
 ....  41  31,8 
38 41
2
 40,15
s  s2  40,15  6,33
41
Medidas de Dispersão
Coeficiente variação ( CV ): é uma medida de variabilidade
como uma fração em relação à média, expresso em
porcentagem. Essa medida é útil quando comparamos
variabilidade de dois ou mais grupos de dados expressos em
unidades de medidas diferentes ou quando a magnitude dos
dados são muito díspares.
n
2


 xi  x
i1
desvio padrão
CV 
 100 
média
n 1
x
 100
42
Medidas de Dispersão
S
Coeficiente de Variação (CV): CV 
100%
X
Município A : CV = 20,11%
Município B : CV = 4,10%
Características
• Medida relativa da dispersão;
• Útil para comparar a variabilidade de dados expressos em
unidades distintas;
• Útil para comparar a variabilidade de dados que são expressos
nas mesmas unidades, porém apresentam valores muito distintos.
Ver exemplo em Levine, pg. 138
43
Medidas de Dispersão
Um instituto de pesquisa de preços, coletou dados de preços
de uma geladeira e de um liquidificador em cinco lojas na
cidade de SP. Compare os preços dos produtos, qual deles
apresenta maior variação de preços?
1
2
3
4
5
média
d. padrão
CV
799
850
900
899
855
860,6
41,72
4,84%
80
95
75
99
75
84,8
11,41
13,5%
Não podemos comparar o desvio
padrão dos preços da geladeira e do
liquidificador pelo fato dos preços das
geladeiras serem uma ordem de
grandeza maior que do liquidificador.
Para comparar tais produtos devemos
calcular o coeficiente de variação dos
dois produtos.
44
Medidas de Dispersão
Um instituto de pesquisa de preços, coletou dados de preços
de uma geladeira e de um liquidificador em cinco lojas na
cidade de SP. Compare os preços dos produtos, qual deles
apresenta maior variação de preços?
CVgeladeria
41,72

 100  4,84%
860,6
CVLiquidif icador 
11,41
 100  13,45%
84,8
loja
Geladeira Liquidificador
1
799
80
2
850
95
3
900
75
4
899
99
5
855
75
média
860,6
84,8
d. padrão
41,72
11,41
CV
4,8%
13,5%
Observe que o coeficiente de variação do liquidificador é
superior ao geladeira. Isso significa que a variação
percentual do Liquidificador é maior do que da Geladeira.
45
O que vimos
até agora
46
Medidas de Tendência Central
n
Média
x
x
i
i1
n
x n1 ; se n é ímpar
2

Mediana md(X)   x n   x n 1
2
; se n é par
 2

2
mo(X) = Observação mais freqüente
0,07
densidade de frequência
Moda
0,06
0,05
0,04
0,03
0,02
0,01
0
20000
30000
40000
50000
Salário
60000
70000
47
Medidas de dispersão
  x (n) - x (1)
 Amplitude:
n
 Desvio médio:
dm(X) 
x
i1
i
x
n
2
 xi  x 
n
 Variância:
var(X)  S 
 Desvio-padrão:
2
n
i1
n -1
dp(X)  Sn  var( X )
48
Para pensar...
Suponha que se adicionou 100, a cada um dos valores
de uma amostra. O que é que acontece ao:
a) Desvio padrão
b) Amplitude interquartil
c) Amplitude
d) Média
e) Mediana
49
Coeficiente de
Assimetria
Tamhane e Dunlop (2000). Statistics and Data Analysis.
Pag 117-118
50
Posição relativa
Distribuições
Simétricas
Simétrico
x
md(X)
mo(X)
Moda
Mediana
Média
51
Posição relativa
Assimetria positiva
Assimetria positiva
ou à direita
Moda
Média
Mediana
mo(X)
md(X)
x
52
Posição relativa
Assimetria negativa
Assimetria negativa
ou à esquerda
Média
Moda
Mediana
mo(X)
md(X)
x
53
Coeficiente de Assimetria de Pearson
3( x  mediana )
P
s
A maioria das distribuições tem um
índice de assimetria entre -3 e 3.
Quando
P>0,
os
ados
são
assimétricos à direta. Quando P<0,
os dados são simétricos à
esquerda. Se P=0, os dados são
simétricos.
Coeficiente de Assimetria do Excel
O indicador de assimetria do Excel (COEFICIENTE DE INCLINAÇÃO)
é calculado pela fórmula abaixo, quando registramos a função
=DISTORÇÃO():
 xi  x 
n


CI 

(n  1).(n  2)  s 
CI = 0
Distribuição Simétrica
CI < 0
Distribuição Assimétrica Negativa
CI > 0
Distribuição Assimétrica Positiva
54
No nosso exemplo dos municípios A e B:
Histograma - Comparação
Histogram a - Município B
0.50
0.5
0.40
0.4
Densidade
Densidade
Histogram a - Município A
0.30
0.20
0.10
0.3
0.2
0.1
0.00
0
12 --| 13
13 --| 14
14 --| 15
15 --| 16
16 --| 17
17 --| 18
18 --| 19
19 --| 20
20 --| 21
21 --| 22
22 --| 23
23 --| 24
24 --| 25
25 --| 26
26 --| 27
12 --| 13
13 --| 14
14 --| 15
15 --| 16
Preço em R$
assimétrica
17 --| 18
18 --| 19
19 --| 20
20 --| 21
21 --| 22
22 --| 23
23 --| 24
24 --| 25
25 --| 26
26 --| 27
Preço em R$
Análise
• Distribuição
preços;
16 --| 17
Análise
de
• Distribuição pouco assimétrica;
• Grande variabilidade;
• Pequena
preços;
• Preço típico entre 13 e 16;
• Preço típico entre 19 e 21;
• Presença de um valor aberrante.
• Não há valores aberrantes.55
variabilidade
de
Medidas-Resumo
Medida-resumo
Média
A
15.67
B
19.99
Mediana
Modo
Desvio padrão
15.10
15.50
3.15
20.00
20.30
0.82
Variância da amostra
Assimetria
Intervalo
Mínimo
9.94
2.04
14.80
12.00
0.67
-0.24
2.80
18.50
Máximo
Contagem
26.80
25
21.30
20
56
Escolhendo uma aplicação
Você
foi
departamento
contratado
financeiro
para
de
trabalhar
uma
no
conhecida
editora de livros cuja matriz fica na Europa. Sua
primeira tarefa é sugerir uma aplicação à
empresa. Você pode aplicar na PPN (empresa do
setor petroquímico) ou nas ações que compõem o
fundo IBP.
Ações_IBP_PPN.xls
57
58
Fechamento – IBP
Agosto/94 a Janeiro/04
59
Fechamento – PPN
Agosto/94 a Dezembro/04
60
-1
-2
-3
61
02/12/2003
02/08/2003
02/04/2003
02/12/2002
02/08/2002
02/04/2002
02/12/2001
02/08/2001
02/04/2001
02/12/2000
02/08/2000
02/04/2000
02/12/1999
02/08/1999
02/04/1999
02/12/1998
02/08/1998
02/04/1998
02/12/1997
02/08/1997
02/04/1997
02/12/1996
02/08/1996
02/04/1996
02/12/1995
02/08/1995
02/04/1995
02/12/1994
02/08/1994
Retornos diários (%) – IBP
Agosto/94 a Janeiro/04
4
3
2
1
0
-5
-10
-15
62
02/12/2003
02/08/2003
02/04/2003
02/12/2002
02/08/2002
02/04/2002
02/12/2001
02/08/2001
02/04/2001
02/12/2000
02/08/2000
02/04/2000
02/12/1999
02/08/1999
02/04/1999
02/12/1998
02/08/1998
02/04/1998
02/12/1997
02/08/1997
02/04/1997
02/12/1996
02/08/1996
02/04/1996
02/12/1995
02/08/1995
02/04/1995
02/12/1994
02/08/1994
Retornos (%) diários– PPN
PN Agosto/94 a Dezembro/03
Retorno
20
15
10
5
0
-2
,7
4
-2
,2
4
-1
,7
4
-1
,2
3
-0
,7
3
-0
,2
3
0,
27
0,
77
1,
28
1,
78
2,
28
2,
78
Densidade de freqüência
-0,4
-0
,2
1
-0
,0
5
0,
11
0,
27
0,
44
0,
60
0,
76
-0
,3
8
-0
,5
4
-0
,7
0
-0
,8
6
-1
,0
3
Comparação dos retornos
IBP
2,1
1,6
1,1
0,6
0,1
Retornos
PPN
0,85
0,75
0,65
0,55
0,45
0,35
0,25
0,15
0,05
-0,05
Retorno
63
Comparação dos retornos
Frequência acumulada
Gráfico da freqüência acumulada
1
0,9
0,8
0,7
0,6
0,5
0,4
0,3
0,2
0,1
0
-3,0
IBP
PPN
-2,0
-1,0
0,0
1,0
2,0
3,0
Retornos
64
Comparação dos retornos
Densidade de freqüência
Histogramas alisados
2
1,5
IBP
PPN
1
0,5
0
-3,0 -2,0
-1,0
0,0
1,0
2,0
3,0
Retornos
65
... da aula passada
Exercício - Bussab e Morettin (pg. 26)
A Editora Moderna, desejando melhorar o nível
de seus funcionários em cargos de chefia,
montou um curso experimental e indicou 25
funcionários para a 1ª turma. Como havia
dúvidas quanto à adoção de um único critério de
avaliação, cada instrutor adotou seu próprio
sistema de aferição. Usando os dados da tabela
a seguir, responda as questões:
66
Dados
Func
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Seção
P
P
P
P
P
P
P
T
T
T
T
T
T
T
V
V
V
V
V
V
V
V
V
V
V
Administração
8.0
8.0
8.0
6.0
8.0
8.0
8.0
10.0
8.0
10.0
8.0
8.0
6.0
10.0
8.0
8.0
8.0
6.0
6.0
6.0
8.0
6.0
8.0
8.0
8.0
Direito
9.0
9.0
9.0
9.0
9.0
9.0
9.0
9.0
9.0
9.0
9.0
9.0
9.0
9.0
9.0
9.0
9.0
9.0
9.0
9.0
9.0
9.0
9.0
9.0
9.0
Redação
8.6
7.0
8.0
8.6
8.0
8.5
8.2
7.5
9.4
7.9
8.6
8.3
7.0
8.6
8.6
9.5
6.3
7.6
6.8
7.5
7.7
8.7
7.3
8.5
7.0
Estatística
9.0
9.0
8.0
8.0
9.0
10.0
8.0
8.0
9.0
8.0
10.0
7.0
7.0
9.0
9.0
7.0
8.0
9.0
4.0
7.0
7.0
8.0
10.0
9.0
9.0
Inglês
B
B
D
D
A
B
D
B
B
B
C
D
B
A
C
A
D
C
D
C
D
C
C
A
B
Metodologia
A
C
B
C
A
A
C
C
B
C
B
B
C
B
B
A
C
C
C
B
B
A
C
A
A
Política
9.0
6.5
9.0
6.0
6.5
6.5
9.0
6.0
10.0
9.0
10.0
6.5
6.0
10.0
10.0
9.0
10.0
6.0
6.0
6.0
6.5
6.0
9.0
6.5
9.0
Economia
8.5
8.0
8.5
8.5
9.0
9.5
7.0
8.5
8.0
7.5
8.5
8.0
8.5
7.5
7.0
7.5
7.5
8.5
9.5
8.5
8.0
9.0
7.0
9.0
8.5
67
Exercício - Bussab e Morettin (pg. 26)
a) Após observar cada variável e com o intuito de
resumi-las, classifique cada uma delas.
b) Construa gráficos e tabelas para cada uma das
variáveis envolvidas no problema.
c) Compare e indique as diferenças existentes
entre as distribuições das variáveis Direito, Política
e Estatística.
Entregar exercício, na próxima aula, em grupos
de até 3 alunos.
68
Exercício de hoje
Uma Instituição de Ensino utiliza duas gráficas para
encadernar suas publicações. Analise o tempo que essas
empresas levam para realizar seus trabalhos (faça gráficos e
calcule todas as estatísticas descritivas vistas no curso).
5
7
5
5
5
1
3
4
3
3
Empresa A
2
4
5
3
3
7
2
5
16
1
5
3
5
3
4
2
5
2
2
2
6
7
14
9
8
12
6
8
9
13
Empresa B
11
10
6
5
9
7
11
8
7
13
Entregar exercício, na próxima aula,
em grupos de até 3 alunos.
7
6
9
5
5
6
10
6
5
5
69
Exercício
Os dados do próximo slide são dos ganhos ou
perdas diárias do índice Bovespa da Bolsa de
Valores do Estado de São Paulo. O período
considerado foi dividido em duas partes, antes da
desvalorização do real em janeiro de 1999 e depois
da desvalorização.
Se você tivesse que decidir investir na bolsa, qual
dos dois períodos você preferiria? Por quê?
70
04/07/94 até
30/12/98
media
0.06
d.p.
3.02
min
-17.23
q1
-1.26
q2
0.18
q3
1.56
max
22.81
moda
0.00
assimetria 0.08
curtose 6.78
04/01/99 até
26/03/03
media
0.05
d.p.
2.31
min
-10.50
q1
-1.29
q2
-0.03
q3
1.44
max
28.82
moda
0.00
assimetria
1.69
curtose
23.24 71