Apostila_Slides_AnEstatistica GST0073

Download Report

Transcript Apostila_Slides_AnEstatistica GST0073

Centro Universitário Estácio de Sá de Santa Catarina
Curso de Graduação em Administração - GST0073
Prof. Hubert Chamone Gesser, Dr.
Graduação em Administração - ESAG/UDESC
Doutorado e Mestrado em Engenharia de Produção - UFSC
Material Didático da Estácio
LIVROS DE ESTATÍSTICA
3
- SUMÁRIO -
Conceitos Introdutórios
Medidas de Assimetria e Curtose
Medidas de Tendência Central
Distribuições Binomial e Normal
Medidas de Ordenamento
Correlação Linear
Medidas de Dispersão
Regressão Linear
Gráficos em Microsoft Excel
Números Índices
Conceitos Introdutórios
Disciplina de Análise Estatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
ESTATÍSTICA
ADMINISTRAÇÃO
A administração é o processo de planejar, organizar, liderar e
controlar os esforços realizados pelos membros da organização e o
uso de todos os recursos organizacionais para alcançar os
objetivos estabelecidos.
ESTATÍSTICA
Origem no latim
status (estado) + isticum (contar)
Informações referentes ao estado
Coleta, Organização, Descrição, Análise e Interpretação de Dados
ESTATÍSTICA
O Que é Estatística?
Para Sir Ronald A. Fisher
(1890-1962):
Estatística é o estudo das
populações, das variações e dos
métodos de redução de dados.
ESTATÍSTICA
O Que é Estatística?
“Eu gosto de pensar na
Estatística como a
ciência de
aprendizagem a partir
dos dados...”
Jon Kettenring
Presidente da
American Statistical Association, 1997
ESTATÍSTICA
O Que é Estatística (definição)?
“Estatística é um conjunto de técnicas e
métodos que auxilia o processo de tomada de
decisão na presença de incerteza.”
Estatística Descritiva  coleta, organização e descrição dos dados.
Estatística Inferencial  análise e interpretação dos dados.
ESTATÍSTICA
LIVROS DE ESTATÍSTICA
ESTATÍSTICA
Panorama Histórico
Desde a Antiguidade, vários povos já registravam o número
de habitantes, de nascimentos e óbitos, que hoje chamamos de
“estatísticas”.
Na Idade Média, colhiam-se informações, geralmente com
finalidades tributárias ou bélicas.
O Livro dos Impostos
ESTATÍSTICA
À partir do século XVI começaram a surgir as primeiras
análises sistemáticas de fatos sociais.
No século XVIII o estudo de tais fatos foi adquirindo feição
verdadeiramente científica. Gottfried Achenwall batizou a nova
ciência com o nome de Estatística, determinando o seu objetivo
e suas relações com as ciências.
O verbete “statistics” apareceu na
Enciclopédia Britânica em 1797.
ESTATÍSTICA
Método Científico
Muitos dos conhecimentos que temos foram obtidos da
Antiguidade por acaso e, outros, por necessidades práticas, sem
aplicação de um método.
Atualmente, quase todo acréscimo
resultada da observação e do estudo.
de
conhecimento
Método é um conjunto de meios dispostos convenientemente
para se chegar a um fim que se deseja.
ESTATÍSTICA
Método Experimental
O método experimental consiste em manter constantes
todas as causas (fatores), menos uma, e variar esta causa de
modo que o pesquisador possa descobrir seus efeitos, caso
existam.
Método Estatístico
O método estatístico, diante da impossibilidade de manter as
causas constantes, admitem todas essas causas presentes
variando-as,
registrando
essas
variações
e
procurando
determinar, no resultado final, que influências cabem a cada uma
delas.
ESTATÍSTICA
Fases do Método Estatístico
1) Coleta de dados
A coleta direta de dados pode ser classificada relativamente
ao fator tempo em:
 contínua: quando feita continuamente;
 periódica: quando feita em intervalos constantes de tempo;
 ocasional: quando feita extemporaneamente,
atender a uma conjuntura ou a uma emergência.
a
fim
de
ESTATÍSTICA
2)
Crítica dos dados
Obtidos os dados, eles devem ser cuidadosamente
criticados, à procura de possíveis falhas e imperfeições.
A crítica é externa quando visa às causas dos erros por
parte do informante, por distração ou má interpretação das
perguntas que lhe foram feitas; e é interna quando visa a
observar os elementos originais dos dados da coleta.
3)
Apuração dos dados
Nada mais é do que a soma e o processamento dos dados
obtidos e a disposição mediante critérios de classificação.
Pode ser manual, eletromecânica ou eletrônica.
ESTATÍSTICA
4)
Exposição ou apresentação dos dados
Por mais diversa que seja a finalidade que se tenha em
vista, os dados devem ser apresentados sob a forma
adequada (tabelas ou gráficos), tornando mais fácil o exame
daquilo que está sendo objeto de tratamento estatístico e
ulterior obtenção de medidas típicas.
5)
Análise dos resultados
Para tirar conclusões sobre o todo (população) a partir de
informações fornecidas por parte representativa do todo
(amostra).
ESTATÍSTICA
Uma representação didática …
Dados
Estatística
Informação
Conhecimento
Decisão
ESTATÍSTICA
ESTATÍSTICA
Fonte: http://www.bocamaldita.com/1119733943/nova-charge-no-ar-contra-corrupcao/
ESTATÍSTICA
ESTATÍSTICA
A Estatística nas Empresas
A direção de qualquer tipo de empresa, exige de seu
administrador a tarefa de tomar decisões. O conhecimento e o uso
da Estatística facilitarão seu trabalho de planejar, organizar,
dirigir e controlar a empresa.
Por
meio
recenseamento
da
de
sondagem,
opiniões,
da
coleta
pode-se
de
dados
conhecer
a
e
de
realidade
geográfica e social da empresa, entre outros, e estabelecer suas
metas, seus objetivos de curto, médio e longo prazos.
ESTATÍSTICA
A Estatística ajudará também na seleção e organização da
estratégia a ser adotada no empreendimento e, ainda, na escolha
das técnicas de verificação e avaliação da quantidade e qualidade
do produto, e mesmo possíveis lucros e/ou perdas.
Tudo que se pensou e se planejou precisa ficar registrado. O
esquema do planejamento é o plano, que pode ser resumido, com
auxílio da Estatística, em tabelas e gráficos, que facilitarão a
compreensão visual dos cálculos matemático-estatísticos que lhes
deram origem.
ESTATÍSTICA
SOFTWARES ESTATÍSTICOS
•
•
•
•
•
•
•
SPSS
Epidata
Bioestat
Excel
STATA
SAS
Epi Info
Medidas de Tendência Central
Disciplina de Análise Estatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
ESTATÍSTICA
MEDIDAS DE TENDÊNCIA CENTRAL
Nos dão uma ideia de onde se localiza o centro, o ponto
médio de um determinado conjunto de dados.
f
x
Medidas: Média, Moda e Mediana.
ESTATÍSTICA
Fonte: renovadoresudf.wordpress.com
ESTATÍSTICA
MÉDIA
É um valor típico representativo de um conjunto de
dados. Fisicamente representa o ponto de equilíbrio da
distribuição.




Média
Média
Média
Média
Aritmética
Ponderada
Geométrica
Harmônica
ESTATÍSTICA
MÉDIA
É um valor típico representativo de um conjunto de dados.
Fisicamente representa o ponto de equilíbrio da distribuição.
Modos de calcular
1) para dados simples
x=Sx/n
2) para valores distintos
x = S fx / n
3) para agrupamentos em classes
x = S fx / n
ESTATÍSTICA
MÉDIA
1) Cálculo para dados simples
x=Sx/n
16 18 23 21
17 16 19 20
S x = Soma dos valores
n = tamanho da amostra
x = (16+18+23+21+17+16+19+20)
8
x = 18,75
ESTATÍSTICA
MÉDIA
2) Cálculo para valores distintos
x
2
3
4
5
6
7
8
f
fx
3
6
3
9
4 16
9 45
6 36
2 14
1
8
Total 28 134
x = S fx / n
S fx = Soma dos produtos
dos valores distintos
com a frequência
n = tamanho da amostra
x = 134
28
x = 4,7857
ESTATÍSTICA
MÉDIA
3) Cálculo para agrupamentos em classes
Classes
39
50
61
72
83
Total
50
61
72
83
94
f
x
fx
4
5
5
6
5
44,5
55,5
66,5
77,5
88,5
178
277,5
332,5
465
442,5
25
-
1695,5
x = S fx / n
S fx = Soma dos produtos
dos valores distintos
com a frequência
n = tamanho da amostra
x = 1695,5
25
x = 67,82
ESTATÍSTICA
Fonte:http://pliniogeo.blogspot.com.br/2011/06/outdoors-colocados-em-jaragua-do-sul-sc.html
ESTATÍSTICA
MEDIANA
É o valor que ocupa a posição central de um conjunto de
dados ordenados.
Para um número par de termos a mediana é obtida através
da média aritmética dos dois valores intermediários.
Interpretação:
50% dos valores estão abaixo ou coincidem com a mediana e
50% estão acima ou coincidem com a mediana.
ESTATÍSTICA
MEDIANA
Fonte: http://guiacemtiradentes.blogspot.com.br/2013/03/moda-mediana-media-matematica.html
ESTATÍSTICA
Roteiro para o Cálculo do Valor da Mediana:



Fazer a disposição em rol
Calcular a posição da mediana
Encontrar o valor
ESTATÍSTICA
MEDIANA
1) Cálculo da mediana para dados simples
2 3 4 5 6
7 8 9 10
PMd =(n+1) / 2
PMd = (9+1) / 2
PMd = 5o Termo
Mediana (Md) = 6
ESTATÍSTICA
MEDIANA
2) Cálculo da mediana para valores distintos
x
2
3
4
5
6
7
8
f
3
3
4
9
6
2
1
Total 28
fa
3o
6o
10o
19o
25o
27o
28o
-
PMd =(n+1) / 2
PMd = (28+1) / 2
PMd = 14,5
x entre 14o e 15o Termo
Mediana (Md) = 5
ESTATÍSTICA
MEDIANA
3) Cálculo da mediana para agrupamentos em classes
Classes
39
50
61
72
83
Total
50
61
72
83
94
f
4
5
5
6
5
25
x
fa
44,5 4o
55,5 9o
66,5 14o
77,5 20o
88,5 25o
-
-
PMd =(n+1) / 2
PMd = (25+1) / 2
PMd = 13o Termo
Classe Mediana
61
72
Mediana (Md) = 66,5 (estimativa)
ESTATÍSTICA
MEDIANA
3) Cálculo da mediana para agrupamentos em classes
Pode-se fazer a interpolação da classe mediana
Md = Li + ((PMd - faa) / f ) . A
Classe Mediana
61
72
Li = limite inferior da classe mediana
PMd = posição da mediana
faa = frequência acumulada da classe anterior
f = frequência da classe mediana
A = amplitude da classe mediana
ESTATÍSTICA
MEDIANA
3) Cálculo da mediana para agrupamentos em classes
Interpolação da classe mediana
Md = Li + ((PMd - faa) / f ) . A
Classe Mediana
61
72
Md = 61 + ((13 - 9) / 5) . 11
Mediana (Md) = 69,8
ESTATÍSTICA
Interpretação da Mediana:
50% dos valores estão abaixo ou coincidem com a mediana e
50% estão acima ou coincidem com a mediana.
Na Empresa ABC o
salário mediano é de
R$2.800,00
ESTATÍSTICA
MODA
É o valor que ocorre com maior frequência em um conjunto
de dados. Símbolo = Mo
1) Moda para dados simples
Exemplos:
2, 3, 4, 5, 6, 7, 8
AMODAL
2, 3, 3, 4, 5, 6 ,7
MODA = 3
2, 3, 3, 4, 5, 5, 6
BIMODAL (Mo = 3 e Mo = 5)
ESTATÍSTICA
MODA
2) Moda para valores distintos
x
2
3
4
5
6
7
8
f
3
3
4
9
6
2
1
Total 28
O valor 5 tem o maior
número de ocorrências (9)
Mo = 5
ESTATÍSTICA
MODA
3) Moda para agrupamentos em classes
Classes
39
50
61
72
83
Total
50
61
72
83
94
f
4
5
5
6
5
25
x
fa
44,5 4o
55,5 9o
66,5 14o
77,5 20o
88,5 25o
-
-
Moda Bruta
Ponto médio da classe de
maior frequência
Mo = 77,5
É uma estimativa
ESTATÍSTICA
MODA
3) Moda para agrupamentos em classes
Moda de King
Mo = Li + (A . f2 / (f1 + f2))
Li = limite inferior da classe modal
A = amplitude do intervalo da classe modal
f1 = frequência da classe anterior a modal
f2 = frequência da classe posterior a modal
Mo = 72 + (11 . 5)
5+5
Mo = 77,5
ESTATÍSTICA
A Moda pode ser usada com dados nominais.
Fonte: http://lelima.com/enter/?tag=desenho-de-moda
ESTATÍSTICA
USO DAS MEDIDAS DE TENDÊNCIA CENTRAL
MÉDIA: Apropriada para Dados Numéricos
MODA:
Apropriada para Dados Nominais
MEDIANA: Apropriada para Dados Ordinais
Dados Nominais: Só se usa a Moda.
Dados Ordinais: Pode-se usar a Mediana e a Moda.
Dados Numéricos: Pode-se usar a Média, a Mediana e a Moda.
ESTATÍSTICA
MÉDIA x MEDIANA x MODA
Quando uma distribuição é simétrica, as três medidas coincidem.
A assimetria, porém, as torna diferentes e essa diferença é tanto
maior quanto maior é a assimetria. Assim, em uma distribuição
em forma de sino (normal), temos:
ESTATÍSTICA
USO DAS MEDIDAS DE TENDÊNCIA CENTRAL
O salário médio dos empregados é uma relação entre soma e
contagem, isto é, o somatório dos salários recebidos dividido
pelo número empregados dessa indústria.
A mediana salarial dos empregados de uma indústria é o salário
que separa os 50% menores dos 50% maiores.
O salário modal dos empregados de uma indústria é o salário
mais comum, isto é, o salário recebido pelo maior número de
empregados dessa indústria.
ESTATÍSTICA
FUNÇÕES
FÓRMULAS NO EXCEL
Contagem Numérica
=CONT.NÚM(A1:A30)
Mínimo
Máximo
Total (Soma)
Média
Moda
Mediana
=MÍNlMO(A1:A30)
=MÁXlMO(A1:A30)
=SOMA(A1:A30)
=MÉDIA(A1:A30)
=MODO(A1:A30)
=MED(A1:A30)
Quartil 3
Percentil 85
=QUARTIL(A1:A30;3)
=PERCENTIL(A1:A30;0,85)
ESTATÍSTICA
EXERCÍCIO No 1
Determine a média, a mediana e a moda para o seguinte
conjunto de dados
6 5 8 4 7 6 9 7 3
ESTATÍSTICA
EXERCÍCIO No 2
Determine o menor valor, o maior valor, a média, a mediana
e a moda para o seguinte conjunto de dados
12 32 54 17 82 99 51 11 44 22
22 33 44 52 76 41 37 10 5 87
Medidas de Ordenamento
Disciplina de Análise Estatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
ESTATÍSTICA
MEDIDAS DE ORDENAMENTO
A mediana caracteriza uma série de valores devido à sua posição
central, mas também separa a série em dois grupos que
apresentam o mesmo número de valores.
Assim, além das medidas de posição, há outras que, consideradas
individualmente, não são medidas de tendência central, mas
estão ligadas à mediana relativamente à sua segunda
característica. Essas medidas - os quartis, os percentis e os
decis - são, juntamente com a mediana, conhecidas pelo nome
genérico de separatrizes (medidas de ordenamento).
ESTATÍSTICA
MEDIDAS DE ORDENAMENTO
Roteiro de Cálculo:



Fazer a disposição em rol
Calcular a posição da medida de ordenamento
Encontrar o valor
56
ESTATÍSTICA
Dr. William Mendenhall
North Carolina State University
Dr. Terry Sincich
University of South Florida
MEDIDAS DE ORDENAMENTO
57
ESTATÍSTICA
Cálculo de posições pela definição de Mendenhall e Sincich
q  n  1
PosiçãoQuartilq 
4
d  n  1
PosiçãoDecild 
10
c  n  1
PosiçãoCentilc 
100
58
ESTATÍSTICA
MEDIDAS DE ORDENAMENTO
São os valores que subdividem uma disposição em rol
Medidas: QUARTIS, DECIS E PERCENTIS
Os Quartis dividem a disposição em 4 partes iguais
Q1, Q2, Q 3
Os Decis dividem a disposição em 10 partes iguais
D1, D2, D3, D4, D5, D6, D7, D8, D9
Os Percentis dividem a disposição em 100 partes iguais
P1, P2, P3, P4, P5, P6, ... , P99
ESTATÍSTICA
QUARTIS
Os Quartis dividem a disposição em 4 partes iguais
Q1, Q2, Q 3
Entre cada quartil há 25% dos dados da disposição
Posição do Primeiro Quartil (Q1) = (n + 1) / 4
Posição do Segundo Quartil (Q2) = 2.(n + 1) / 4
Posição do Terceiro Quartil (Q3) = 3.(n + 1) / 4
O segundo quartil coincide com a Mediana (Q2 = Md)
ESTATÍSTICA
QUARTIS
Os Quartis dividem a disposição em 4 partes iguais
Q1, Q2, Q 3
1, 1, 1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 5, 5, 6, 7, 7, 7, 8, 8, 8, 8, 9, 9, 9
n = 27
Q1
Q2
Q3
7o termo
14o termo
21o termo
ESTATÍSTICA
DECIS
Os Decis dividem a disposição em 10 partes iguais
D1, D2, D3, D4, D5, D6, D7, D8, D9
Entre cada decil há 10% dos dados da disposição
Posição do Primeiro Decil (D1) = (n + 1) / 10
Posição do Segundo Decil (D2) = 2.(n + 1) / 10
Posição do Nono Decil (D9) = 9.(n + 1) / 10
O Quinto Decil coincide com a Mediana (D5 = Md)
ESTATÍSTICA
PERCENTIS
Os percentis dividem a disposição em 100 partes iguais
P1, P2, P3, P4, P5, P6, ... , P99
Entre cada percentil há 1% dos dados da disposição
Posição do Primeiro Percentil (P1) = (n + 1) / 100
Posição do Segundo Percentil (P2) = 2.(n + 1) / 100
Posição do Nonagésimo Nono Percentil (P99) = 99.(n + 1) / 100
P50 = Md
P25 = Q1
P75 = Q3
ESTATÍSTICA
EXERCíCIOS
1) Dado o conjunto de dados:
a) apresente a disposição em rol;
b) o Percentil 50,
c) o Primeiro Quartil,
d) a Média,
e) a Moda e
f) a Mediana
10 13 24
45 66 77 11
14 26 33 65
21 57
ESTATÍSTICA
2) Em uma amostra com 2789 valores qual é a posição do
oitavo decil, da mediana, do segundo decil, do terceiro
quartil e do segundo quartil?
ESTATÍSTICA
3) Determine a média, a moda, a mediana, o 1o quartil, o 5o
decil, o percentil 75 e o percentil 50 para a seguinte
distribuição por valores distintos?
Lucro (US$ mil)
64
65
66
67
68
69
70
71
72
f
4
10
12
12
15
14
9
5
2
Medidas de Dispersão
Disciplina de Estatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
ESTATÍSTICA
Tudo é incerto e derradeiro.
Tudo é disperso, nada é
inteiro.
(Fernando Pessoa)
ESTATÍSTICA
DISPERSÃO DOS DADOS
Vimos que um conjunto de valores pode ser convenientemente
sintetizado, por meio de procedimentos matemáticos, em
poucos valores representativos - média aritmética, mediana e
moda.
Para qualificar os valores de uma dada variável, ressaltando a
maior ou menor dispersão ou variabilidade entre esses valores
e a sua medida de posição, a Estatística recorre às medidas de
dispersão ou de variabilidade.
Amplitude, Variância, Desvio Padrão e Coeficiente de Variação
ESTATÍSTICA
Fonte: http://jesseantenado.blogspot.com.br/2012_01_01_archive.html
ESTATÍSTICA
Fonte: http://politikei.blogspot.com.br/2011_01_01_archive.html
ESTATÍSTICA
DISPERSÃO DOS DADOS
É frequentemente chamada de variabilidade.
Medidas mais comuns: Variância, Desvio Padrão, Amplitude
e Coeficiente de Variação
f
Dispersão dos dados
na amostra
Dispersão dos dados
na população
x
ESTATÍSTICA
Dispersão na População
É uma forma de se ver o quanto os dados se afastam da média.
Exemplo: Vilarejo com apenas 11 pessoas
135cm 152cm
136cm 152cm
138cm 157cm
141cm 163cm
143cm 170cm
152cm
Alturas de 11 pessoas
Média = 149cm
Mediana e Moda = 152cm
Valor Máximo = 170cm
Valor Mínimo = 135cm
Amplitude = 35cm
ESTATÍSTICA
Dispersão na População
Alturas
x-x
(N=11)
135cm
136cm
138cm
141cm
143cm
152cm
152cm
152cm
157cm
163cm
170cm
Total
135-149
136-149
138-149
141-149
143-149
152-149
152-149
152-149
157-149
163-149
170-149
-14
-13
-11
-8
-6
3
3
3
8
14
21
(x - x)2
196
169
121
64
36
9
9
9
64
196
441
1314
2 Variância
= 1314 / 11
= 119,454 cm2
 Desvio Padrão
=
119,454
= 10,92 cm
Soma dos desvios
quadráticos
ESTATÍSTICA
VARIÂNCIA E DESVIO PADRÃO NA POPULAÇÃO
Variância da população
 2 = S ( x - x )2 / N
Desvio Padrão da população = Raiz quadrada da variância
  2
Como a dispersão nas amostras é menor do que na
população, se faz um ajuste matemático.
ESTATÍSTICA
VARIÂNCIA E DESVIO PADRÃO NA AMOSTRA
Variância da Amostra ( s2 ou v )
s2 = S ( x - x )2 / ( n -1 )
Desvio Padrão da amostra ( s ou DP ) = Raiz quadrada da variância
s  s2
A dispersão nas amostras é menor do que na população,
por isso é que se faz este ajuste matemático
ESTATÍSTICA
DESVIO PADRÃO
SIGNIFICADO:
É um modo de representar a dispersão dos dados ao redor da média.
f
Média
x
ESTATÍSTICA
DESVIO PADRÃO
A curva A mostra uma dispersão dos dados maior do que a curva B,
logo o desvio padrão de A é maior do que o de B.
f
f
Curva A
Média
Curva B
x
Média
x
ESTATÍSTICA
COEFICIENTE DE VARIAÇÃO
O desvio padrão depende da unidade de medida usada,
assim um desvio medido em dias será maior do que um medido
em meses.
O coeficiente de variação expressa o desvio-padrão como
porcentagem do valor da média.
COEF. VARIAÇÃO = 100 . DESVIO PADRÃO
MÉDIA
Quanto menor for este coeficiente mais homogênea é a amostra.
ESTATÍSTICA
COEFICIENTE DE VARIAÇÃO
Classificação da proporção que o desvio padrão apresenta sobre a média.
GRAU DE HOMOGENEIDADE DOS DADOS
até 10%

ÓTIMO
de 10% a 20%

BOM
de 20% a 30%

REGULAR
acima de 30%

RUIM
ESTATÍSTICA
FUNÇÕES
FÓRMULAS NO EXCEL
Contagem Numérica
=CONT.NÚM(A1:A30)
Mínimo
Máximo
Total (Soma)
Média
Moda
Mediana
=MÍNlMO(A1:A30)
=MÁXlMO(A1:A30)
=SOMA(A1:A30)
=MÉDIA(A1:A30)
=MODO(A1:A30)
=MED(A1:A30)
Variância
Desvio padrão
=VAR(A1:A30)
=DESVPAD(A1:A30)
ESTATÍSTICA
EXERCÍCIOS
1) Determine a média, a amplitude, a variância, o desvio padrão e o
coeficiente de variação da seguinte amostra de dados:
4 5 5 6
6 7 7 8
ESTATÍSTICA
2) Determine o valor de n, a amplitude, a média, o desvio padrão e o
coeficiente de variação da seguinte amostra de dados:
22
76
21
28
22
53
32
24
58
33
47
36
45
21
92
73
28
88
22
78
11
11
24
99
46
43
16
29
21
18
Como a base de dados é
extensa sugere-se que os
cálculos sejam feitos com o
uso da planilha eletrônica
Microsoft Excel .
Gráficos em Microsoft Excel
Disciplina de Análise Estatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
ESTATÍSTICA
GRÁFICOS
O gráfico é uma forma de apresentação dos dados estatísticos,
cujo objetivo é o de produzir, no investigador ou no público em
geral, uma impressão mais rápida e viva do fenômeno em
estudo.
A representação gráfica de um fenômeno deve obedecer a certos
requisitos fundamentais para ser realmente útil:
Simplicidade
Clareza
Veracidade
ESTATÍSTICA
GRÁFICOS
Gráfico é a forma geométrica de apresentação dos dados e
respectivos resultados de sua análise.
A escolha do modelo ideal de representação gráfica depende das
preferências e do senso estético do elaborador.
Vantagens:
- Permitem a síntese dos resultados;
- Auxiliam o pesquisador na análise dos dados e
- Facilitam a compreensão das conclusões do autor.
ESTATÍSTICA
NORMAS PARA A CONFECÇÃO DE GRÁFICOS
Deve facilitar a interpretação dos dados para um leigo;
Não há a necessidade de se colocar título se estiver na mesma página
da tabela correspondente;
Há a necessidade de se colocar o título se a tabela correspondente
não estiver na mesma página.
O senso estético individual determina o espaço do gráfico (L x A);
As colunas, barras, linhas e áreas gráficas devem ser ordenadas de
modo crescente ou decrescente, mas a ordem cronológica prevalece;
ESTATÍSTICA
ORIGEM DOS GRÁFICOS
O diagrama cartesiano é a figura geométrica que deu origem à
técnica de construção de gráficos estatísticos.
Utiliza-se o primeiro quadrante do sistema de eixos coordenados
cartesianos ortogonais.
Ordenadas (eixo y)
1o Quadrante
Abscissas (eixo x)
Eixo y
Eixo x
Frequências
Valores da Variável
ESTATÍSTICA
GRÁFICO EM COLUNAS OU DE BARRAS
Tabela 1: Quantidade de exames realizados
em um determinado laboratório em 2011.
25000
20000
Exames
Quantidade
Hematologia
9824
15000
Bioquímica
21534
10000
Imunologia
15432
5000
Parasitologia
4310
0
Hemat
Bioq
Imunol
Parasit
Fonte: Hipotética
Figura 1: Gráfico em colunas do número de
exames em um determinado laboratório em 2011.
ESTATÍSTICA
GRÁFICO DE BARRAS HORIZONTAL
Tabela 2: Quantidade de exames realizados
em um determinado laboratório em 2011.
Parasit
Exames
Quantidade
Hematologia
9824
Bioquímica
21534
Imunologia
15432
Parasitologia
Imunol
Bioq
Hemat
4310
0
5000
10000
15000
20000
25000
Fonte: Hipotética
Figura 2: Gráfico em barras horizontais do
número de exames realizados em um determinado
laboratório no ano de 2011.
ESTATÍSTICA
GRÁFICO DE SETORES OU CIRCULAR
Tabela 3: Quantidade de exames realizados
em um determinado laboratório em 2011.
Exames
Quantidade
Hematologia
9824
Bioquímica
21534
Imunologia
15432
Parasitologia
4310
Parasit
Hemat
Imunol
Bioq
Fonte: Hipotética
Figura 3: Gráfico circular do número de exames
realizados em um determinado laboratório no ano
de 2011.
ESTATÍSTICA
HISTOGRAMA DE FREQUÊNCIA
Tabela 4: Notas dos alunos na disciplina de
Estatística no curso de Administração (ano x)
12
10
8
Notas
Frequência
6
0
2
2
2
4
7
2
4
6
11
0
4
0a2
6
8
10
8
10
5
Fonte: Dados Fictícios
2a4
4a6
6a8
8 a 10
Figura 4: Histograma das notas dos alunos
ESTATÍSTICA
HISTOGRAMA DE FREQUÊNCIA
• A área do histograma é
proporcional à soma das
frequências;
35
31,4
28,6
30
25
20
• Para
comparar
duas
distribuições, o ideal é utilizar
números percentuais;
20
14,3
15
10
5,7
5
0
0a2
2a4
4a6
6a8
8 a 10
Figura 5: Histograma dos percentuais das notas
dos alunos
ESTATÍSTICA
POLÍGONO DE FREQUÊNCIA
• É um Gráfico em Linha de
uma
distribuição
de
frequência;
35
31,4
30
28,6
25
20
• Para se obter um polígono
(linha
fechada),
deve-se
completar a figura, ligando os
extremos da linha obtida aos
pontos médios da classe
anterior à primeira e posterior
à última, da distribuição.
20
15
14,3
10
5,7
5
0
0
0a2
2a4
4a6
6a8
8 a 10
11
Figura 6: Polígono de Frequência percentual de
das notas dos alunos
ESTATÍSTICA
POLÍGONO DE FREQUÊNCIAS ACUMULADAS
(Sinônimo: Ogiva)
Tabela 5: Notas dos alunos na disciplina de
estatística no ano x
120
100
100
85,7
80
Notas
Frequência F. Acumulada %
57,1
60
0
2
2
5,7
40
2
4
7
25,7
20
4
6
11
57,1
0
6
8
10
85,7
8
10
5
100,0
Fonte: Dados Fictícios
25,7
5,7
0
0a2
2a4
4a6
6a8
8 a 10
Figura 7: Polígono de frequências acumuladas
das notas dos alunos
ESTATÍSTICA
POLÍGONO DE FREQUÊNCIAS ACUMULADAS
(Sinônimo: Ogiva)
Tabela 5: Notas dos alunos na disciplina de
estatística no ano x
120
100
100
85,7
80
Notas
Frequência F. Acumulada %
57,1
60
0
2
2
5,7
40
2
4
7
25,7
20
4
6
11
57,1
0
6
8
10
85,7
8
10
5
100,0
Fonte: Dados Fictícios
25,7
5,7
0
0a2
2a4
4a6
6a8
8 a 10
Figura 7: Polígono de frequências acumuladas
das notas dos alunos
ESTATÍSTICA
GRÁFICO STEM AND LEAF (TRONCO E FOLHAS)
13
22
33
45
53
62
71
14
23
35
47
57
63
72
15 15
28 29
36 37 39 39
58 58 59
65
Conjunto de Dados
Tronco (Stem)
1
2
3
4
5
6
7
Folha (Leaf)
3455
2389
356799
57
37889
235
12
Figura 8: Gráfico Stem-Leaf onde o primeiro
dígito é o tronco e o segundo é a folha
ESTATÍSTICA
GRÁFICO DE BARRAS COM DESVIO PADRÃO
1,95
1,9
1,85
1,8
1,75
1,7
1,65
1,6
1,55
Medicina
Odontologia
Farmacia
Nutrição
Figura 9: Gráfico de barras com os valores médios e o desvio padrão das alturas de
estudantes da faculdade x (valores fictícios).
ESTATÍSTICA
GRÁFICO BOX AND WISKER (Caixa e Fio de Bigode)
1,95m
1,90m
1,85m
1,80m
1,75m
1,70m
1,65m
1,60m
1,55m
Valor Máximo
Percentil 75
Percentil 50
Percentil 25
Valor Mínimo
Figura 10: Gráfico Box and Wisker das alturas dos estudantes de medicina (valores fictícios).
ESTATÍSTICA
GRÁFICO POLAR
É o gráfico ideal para representar séries temporais cíclicas
ESTATÍSTICA
CARTOGRAMA
Cartograma é a representação sobre uma carta geográfica.
ESTATÍSTICA
CARTOGRAMA
ESTATÍSTICA
PICTOGRAMA
O pictograma constitui um dos processos gráficos que melhor fala
ao público, pela sua forma ao mesmo tempo atraente e sugestiva.
A representação gráfica consta de figuras.
ESTATÍSTICA
PICTOGRAMA
Nº de habitantes de 8 províncias de Andaluzia
Medidas de Assimetria e Curtose
Disciplina de Análise Estatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
ESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Horizontal:
Análise Vertical:
Assimétrica Positiva (cauda direita)
Leptocúrtica (alta)
Simétrica
Mesocúrtica
Assimétrica Negativa (cauda esquerda)
Platicúrtica (baixa)
Análise Conjunta:
Assimétrica Positiva Leptocúrtica
Simétrica Mesocúrtica “Curva de Gauss” “Curva Normal”
ESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Horizontal:
Assimétrica Positiva (cauda direita é mais longa)
f
Curva Assimétrica à Direita
x
ESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Horizontal:
Simétrica
f
x
ESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Horizontal:
Assimétrica Negativa (cauda esquerda é mais longa)
f
Curva Assimétrica à Esquerda
x
ESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Vertical:
Leptocúrtica (alta)
f
x
ESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Vertical:
Mesocúrtica
f
x
ESTATÍSTICA
CURVAS DE FREQUÊNCIA
Análise Vertical:
Platicúrtica (baixa)
f
x
ESTATÍSTICA
MENSURANDO A ASSIMETRIA
Em uma distribuição simétrica, a média e a moda coincidem;
Na distribuição assimétrica à esquerda ou negativa, a média é menor que a moda;
Na assimétrica à direita ou positiva, a média é maior que a moda.
ESTATÍSTICA
MEDINDO A ASSIMETRIA (Forma Simples)
Baseando-nos nessas relações entre a média e a moda,
podemos empregá-las para determinar o tipo de
assimetria. Assim, calculando o valor da diferença:
Se
x  Mo  0
assimetria nula ou distribuição simétrica;
Se
x  Mo  0
assimetria negativa ou à esquerda;
Se
x  Mo  0
assimetria positiva ou à direita.
ESTATÍSTICA
COEFICIENTE DE ASSIMETRIA
A medida anterior, por ser absoluta, apresenta a mesma
deficiência do desvio padrão, isto é, não permite a possibilidade
de comparação entre as medidas de duas distribuições. Por
esse motivo, daremos preferência ao coeficiente de assimetria
de Pearson, dado por:
As 
3 x  Md 
s
Se 0,15<|As|<1, a assimetria é moderada;
Se |As|>1, a assimetria é forte.
ESTATÍSTICA
ASSIMETRIA NAS CURVAS DE FREQUÊNCIA
Simétrica
Assimétrica à direita
Assimétrica à esquerda
ESTATÍSTICA
ESTATÍSTICA
MENSURANDO A CURTOSE
Denominamos curtose o grau de achatamento de uma distribuição
em relação a uma distribuição padrão, denominada curva normal.
ESTATÍSTICA
COEFICIENTE PERCENTÍLICO DE CURTOSE
Q3  Q1
C
2P90  P10 
Se C = 0,263, a curva é mesocúrtica;
se C < 0,263, a curva é leptocúrtica;
se C > 0,263, a curva é platicúrtica.
Observação: no Microsoft Excel a interpretação é diferente.
ESTATÍSTICA
COEFICIENTE PERCENTÍLICO DE CURTOSE
ESTATÍSTICA
MEDINDO A CURTOSE NO Microsoft Excel
No Microsoft Excel a interpretação é
diferente, pois é observado se os valores do
coeficiente são positivos ou negativos.
Se Coef = 0, a curva é mesocúrtica;
se Coef > 0, a curva é leptocúrtica;
se Coef < 0, a curva é platicúrtica.
ESTATÍSTICA
Análise de Dados no Microsoft Excel
ESTATÍSTICA
Análise de Dados no Microsoft Excel
FUNÇÕES
FÓRMULAS NO EXCEL
Curtose
=CURT(A1:A30)
Assimetria
=DISTORÇÃO(A1:A30)
Distribuições Binomial e Normal
Disciplina de Análise Estatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
ESTATÍSTICA
PROBABILIDADES
Pierre Simon Marquis de Laplace
Beaumont-en-Auge, 23 de março de 1749
Paris, 5 de março de 1827
Foi um matemático, astrônomo
e físico francês considerado o pai
da Teoria das Probabilidades.
ESTATÍSTICA
PROBABILIDADES
Fonte: http://www.trendfollowingbovespa.com.br/2012_12_01_archive.html
ESTATÍSTICA
DISTRIBUIÇÃO BINOMIAL
Estuda o comportamento amostral de eventos dicotômicos.
Masculino / Feminino
Satisfeito / Insatisfeito
Atrasado / Não-atrasado
Estes eventos são denominados designativos
(sim / não
ou
sucesso / fracasso)
ESTATÍSTICA
DISTRIBUIÇÃO BINOMIAL
Ocorre em experimentos que satisfaçam as seguintes condições:
a.
O experimento deve ser repetido, nas mesmas condições, um
número finito de vezes (n);
b.
As provas repetidas devem ser independentes, isto é, o
resultado de uma não deve afetar os resultados das
sucessivas;
c.
Em cada prova
resultados;
d.
No decorrer do experimento, a probabilidade de sucesso e de
insucesso manter-se-ão constantes.
deve
aparecer
um
dos
dois
possíveis
ESTATÍSTICA
EXPERIMENTO BINOMIAL
Tem as seguintes características
( 1 ) consiste de n ensaios;
( 2 ) cada ensaio tem apenas dois resultados: sim ou não;
( 3 ) os ensaios são independentes entre si, com probabilidade 
de ocorrer sim, sendo  uma constante entre 0 e 1.
Exemplo:
Lançamento de uma moeda 3 vezes e observar o
número de caras.
n=3
 = 0,5
ESTATÍSTICA
DISTRIBUIÇÃO BINOMIAL
ESTATÍSTICA
DISTRIBUIÇÃO BINOMIAL
Binômio de Newton
ESTATÍSTICA
ESTATÍSTICA
ESTATÍSTICA
Binômio de Newton
O nome é dado em homenagem ao
físico e matemático Isaac Newton.
Entretanto deve-se salientar que o
Binômio de Newton não foi o objeto
de estudos de Isaac Newton.
Na verdade o que Newton estudou
foram regras que valem para (a+b)n
quando o expoente n é fracionário
ou inteiro negativo, o que leva ao
estudo de séries infinitas.
ESTATÍSTICA
Simplificando a Fórmula:
Cálculo Probabilístico (Distribuição Binomial):
P (r) =
n!
. pr . (1 - p)n-r
r! . (n - r)!
n = número de tentativas ou repetições do experimento
r = proporção desejada de sucessos
n - r = proporção esperada de fracassos
p = probabilidade de sucessos
ESTATÍSTICA
FATORIAL
6! = 6 . 5 . 4 . 3 . 2 . 1 = 720
5! = 5 . 4 . 3 . 2 . 1 = 120
4! = 4 . 3 . 2 . 1 = 24
3! = 3 . 2 . 1 = 6
n!
2! = 2 . 1 = 2
1! = 1
0! = 1
Por convenção matemática o fatorial de zero é igual a um.
ESTATÍSTICA
DISTRIBUIÇÃO BINOMIAL x DISTRIBUIÇÃO NORMAL
y
y
Média, Moda e
Mediana
x
Média, Moda e
Mediana
x
Variável dicotômica
(sim ou não, sucesso ou fracasso)
Variável contínua
(infinitos resultados possíveis)
Dá para enumerar os possíveis resultados
Não dá para enumerar os possíveis
resultados
ESTATÍSTICA
DISTRIBUIÇÃO NORMAL
Fonte: http://www.ciencias.seed.pr.gov.br/modules/galeria/detalhe.php?foto=1887&evento=1
ESTATÍSTICA
DISTRIBUIÇÃO NORMAL
JOHAN CARL FRIEDRICH GAUSS
(1777-1855)
princeps mathematicorum
Matemático, Astrônomo e Físico
Alemão que contribuiu muito em
diversas áreas da ciência, dentre elas
a teoria dos números,
estatística, análise
matemática, geometria
diferencial, geodésia, geofísica, eletro
estática, astronomia e óptica.
ESTATÍSTICA
DISTRIBUIÇÃO NORMAL
Variável contínua
y
(infinitos resultados possíveis)
Não dá para enumerar
os possíveis resultados
x
Média, Moda e
Mediana
ESTATÍSTICA
CURVA NORMAL
 É descrita pela média e pelo
desvio padrão.
y
 A mediana, a média e a moda
coincidem.
 A curva é simétrica ao redor
da média.
A curva é mesocúrtica.
Média, Moda e
Mediana
x
ESTATÍSTICA
CURVA NORMAL
 As inferências em pesquisas em
administração estão baseadas em
dados, cuja distribuição é normal.
y
 A curva normal (Gauss) é
simétrica, unimodal e tem forma
de sino.
 É assintótica em relação ao eixo
horizontal (eixo x).
Média, Moda e
Mediana
x
ESTATÍSTICA
CURVA NORMAL
ESTATÍSTICA
A ESTATÍSTICA Z
 A estatística Z (standard
score) está baseada na curva
normal.
 Mede o afastamento de um
valor em relação a média em
unidades de desvios padrão.
y
1 DP
Z = x - x
s
1 DP
2 DP
2 DP
3 DP
-3
-2
3 DP
-1
0
+1
+2
+3
x
ESTATÍSTICA
A ESTATÍSTICA Z
y
Exemplo:
A altura média dos estudantes
da ESTÁCIO é de 1,70m com
desvio padrão de 10cm
Z = x - x
s
140 150
-3
-2
160
170
-1
0
180 190 200 x
+1
+2
+3 z
ESTATÍSTICA
ÁREAS DA CURVA NORMAL
Áreas
y
-1DP a +1DP  68,27%
-2DP a +2DP  95,45%
-3DP a +3DP  99,73%
1 DP
1 DP
-1,96DP a +1,96DP  95%
2 DP
2 DP
Média a 1DP  34,13%
Média a 2 DP  47,72%
3 DP
-3 DP
-2 DP
-1 DP
Média a 3DP  49,86%
3 DP
Média, Moda e
Mediana
+1 DP
+2 DP
+3 DP
x
ESTATÍSTICA
ÁREAS DA CURVA NORMAL
y
34,13%
47,72%
49,86%
x
-3
-2
-1
0
+1
+2
+3
z
ESTATÍSTICA
ÁREAS DA CURVA NORMAL
y
68,27%
95,45%
99,73%
x
-3
-2
-1
0
+1
+2
+3
z
ESTATÍSTICA
ESTATÍSTICA
TABELA Z
ESTATÍSTICA
(continuação)
Média, Moda e
Mediana
ESTATÍSTICA
No Microsoft Excel 2010
=DIST.NORM.N(x; média; s; 1)
Fornece o valor da área
entre x e a cauda.
Média, Moda e
Mediana
= DIST.NORMP.N(z;0)
Fornece o valor da área
entre z e a cauda.
ESTATÍSTICA
Conclusão...
Possibilita estimar o percentual de casos acima ou
abaixo de um determinado valor.
Aplicações Práticas...
- Pode-se estimar a probabilidade de um pneu de
caminhão durar mais de 70.000Km
- Pode-se estimar o percentual de funcionários que
realizam uma tarefa abaixo de um determinado tempo.
- Pode-se estimar o percentual de peças produzidas
abaixo de um padrão mínimo de qualidade.
ESTATÍSTICA
EXERCÍCIOS
1) O processo de fabricação de uma determinada empresa apresenta a
média de peso de uma peça igual a 100g e desvio padrão de 1,5 g.
Qual é a proporção de peças entre 100 e 102g?
Z = (x - média) / desvio padrão = (102 - 100) / 1,5 = 1,33
?
na tabela qdo z = 1,33 a área é de 50% - 9,18% = 40,82%
100 102
0
?
x
z
ESTATÍSTICA
2) Calcule as seguintes proporções de peças:
(a) com peso entre 98 e 102g
(b) abaixo de 98g
(c) acima de 102g
(d) abaixo de 100g
(e) abaixo de 96,5g
Correlação Linear
Disciplina de Análise Estatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
ESTATÍSTICA
CORRELAÇÃO E REGRESSÃO
Sendo a relação entre as variáveis de natureza quantitativa, a
CORRELAÇÃO é o instrumento adequado para descobrir e
medir essa relação.
Uma vez caracterizada a relação, procuramos descrevê-la
através de uma função matemática. A REGRESSÃO é o
instrumento adequado para a determinação dos parâmetros
da função.
ESTATÍSTICA
DIAGRAMA DE DISPERSÃO
Mostra o comportamento de duas variáveis quantitativas
(com dados numéricos).
a
a
b
a
b
b
ESTATÍSTICA
CORRELAÇÃO LINEAR POSITIVA
Quando valores pequenos da variável a tendem a estar relacionados
com valores pequenos de b, enquanto que valores grandes de a
tendem a estar relacionados com valores grandes de b.
a
Exemplos:
Peso x Altura
Nível socioeconômico x Volume de vendas
Consumo de Álcool x Preval. Cirrose Hepática
b
ESTATÍSTICA
CORRELAÇÃO LINEAR NEGATIVA
Quando valores pequenos da variável a tendem a estar relacionados
com valores grandes de b, enquanto que valores grandes de a
tendem a estar relacionados com valores pequenos de b.
a
Exemplos:
Renda Familiar x Número de Filhos
Escolaridade x Absenteísmo
Volume de vendas x Passivo circulante
b
ESTATÍSTICA
CORRELAÇÃO NÃO LINEAR
O diagrama de dispersão mostra um conjunto de pontos
aproximando-se mais de uma parábola do que de uma reta.
a
Exemplos:
Coef. de Letalidade (a) x Dose do Medicamento (b)
Custo (a) x Lote Econômico de Compra (b)
b
ESTATÍSTICA
TIPOS DE CORRELAÇÃO
ESTATÍSTICA
TIPOS DE CORRELAÇÃO
ESTATÍSTICA
TIPOS DE CORRELAÇÃO
ESTATÍSTICA
COEFICIENTE DE CORRELAÇÃO DE PEARSON
r =
n . S (X.Y) - S X . S Y
n . S X2 - (S X)2 . n . S Y2 - (S Y)2
S(X.Y) = Fazem-se os produtos X.Y p/ cada par e depois efetua-se a soma
SX = Somatório dos valores da variável X
SY = Somatório dos valores da variável Y
SX2 = Elevam-se ao quadrado cada valor de X e depois efetua-se a soma
SY2 = Elevam-se ao quadrado cada valor de Y e depois efetua-se a soma
ESTATÍSTICA
EXEMPLO
Cálculo do coeficiente de correlação para os dados das variáveis
X = população residente e Y = taxa de cresc. populacional, em 12 vilarejos.
X
Y
101
193
3,2
4,6
.
.
.
42
1452
.
.
.
2,8
39,3
X2
Y2
X.Y
10201 10,24
37249 21,16
.
.
.
.
.
.
323,2
887,8
.
.
.
1764
7,84 117,6
251538 153,55 5706,2
ESTATÍSTICA
r =
n . S (X.Y) - S X . S Y
n . S X2 - (S X)2 . n . S Y2 - (S Y)2
r =
12 . 5706,2 - 1452 . 39,3
12 . 251538 - (1452)2 .
12 . 153,55 - (39,3)2
r = 0,69 (Correlação Linear Positiva
r > 0)
ESTATÍSTICA
COEFICIENTES DE CORRELAÇÃO
Positiva Perfeita
Positiva
r>0
Negativa
r<0
r=1
Negativa perfeita
r = -1
ESTATÍSTICA
COEFICIENTES DE CORRELAÇÃO
Ausência de Correlação
r=0
ESTATÍSTICA
INTERPRETAÇÃO
• O Valor de r (Correlação Linear de Pearson) varia de -1 a +1.
• O sinal indica o sentido (correlação positiva ou negativa).
• O valor indica a força da correlação (Fraca ou Forte)
valor de r
Forte
-1
Relativa
Fraca
- 0,6
Muito
Muito
Ausência
Fraca
Fraca
- 0,3
0
+ 0,3
Relativa
Fraca
+ 0,6
Forte
+1
ESTATÍSTICA
CORRELAÇÃO DE SPEARMAN (Rho)
• Estatística não paramétrica
• Usada em dados que não têm Distribuição Normal
• Usadas com dados Ordinais (Conceitos: A, B, C, D, E)
CORRELAÇÃO TAU DE KENDALL
• Estatística não paramétrica
• Usada em um conjunto pequeno de dados com muitos
postos empatados
ESTATÍSTICA
EXERCÍCIO
1) Coloque V (Verdadeiro) ou F (Falso):
(
) Quando o valor de r for maior que 0,6 ou menor que -0,6 a
correlação entre as duas variáveis em estudo é forte
(
) O sinal negativo de r indica que as variáveis em estudo são
inversamente proporcionais
( ) Ao se encontrar um valor de r = 0,6 não se pode afirmar que
as variáveis sejam diretamente proporcionais.
( ) O coeficiente de correlação de Pearson pode ser aplicado em
dados nominais
Regressão Linear
Disciplina de Análise Estatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
ESTATÍSTICA
REGRESSÃO
Sempre que desejamos estudar determinada variável em função de
outra fazemos uma análise de regressão.
A análise de regressão tem por objetivo descrever, através de um
modelo matemático, a relação entre duas variáveis, partindo de
n observações das mesmas.
A variável a qual desejamos fazer uma estimativa recebe o nome de
variável dependente e a outra recebe o nome de variável
independente.
ESTATÍSTICA
REGRESSÃO
Supondo X a variável independente e Y a dependente, vamos
procurar determinar o ajustamento de uma reta à relação
entre essas variáveis, ou seja, vamos obter uma função
definida por:
Y = a.X + b
onde a e b são coeficientes.
a = Inclinação ou Gradiente (Coef. Angular)
b = Intercepto (Coef. Linear)
ESTATÍSTICA
REGRESSÃO
Sejam duas variáveis X (Notas de Matemática) e Y (Notas de
Estatística), entre as quais exista uma correlação acentuada,
embora não perfeita, como as que formam a tabela a seguir:
ESTATÍSTICA
REGRESSÃO
Podemos concluir, pela forma do
diagrama, que se trata de uma
correlação retilínea, de modo a
permitir o ajustamento de uma
reta, imagem da função definida
por:
Y = a.X + b
ESTATÍSTICA
REGRESSÃO
Legendre, Adrien-Marie (1752-1833)
- Matemático francês, discípulo de
Euler e Lagrange.
- É autor de um clássico trabalho de
geometria, Élements de géométrie.
- Também fez importantes
contribuições em equações
diferenciais, cálculo, teoria das
funções e teoria dos números.
Eu obtive a equação
da reta ... dos mínimos
quadrados ordinários
ESTATÍSTICA
REGRESSÃO
Y = a.X + b
ESTATÍSTICA
REGRESSÃO
ESTATÍSTICA
CÁLCULO DA REGRESSÃO
ESTATÍSTICA
RETA IMAGEM DA REGRESSÃO
ESTATÍSTICA
RETA IMAGEM DA REGRESSÃO (Microsoft Excel)
15
10
5
y = 1,4134x + 3,9094
R² = 0,6913
0
0
2
4
6
8
ESTATÍSTICA
COEFICIENTE DE DETERMINAÇÃO ( R2 )
n
Variação explicada
r 
Variação total
2
Basta elevar o coeficiente
de correlação ao quadrado
R2
r 
2
  yˆ
i 1
n
 y
i 1
i
 y
2
i
 y
2
É quanto a variável X pode explicar da variação em Y
ESTATÍSTICA
INTERPOLAÇÃO E EXTRAPOLAÇÃO
Voltando à tabela das notas, vemos que 4,0 não figura entre as
notas de Matemática. Entretanto, podemos estimar a nota
correspondente em Estatística fazendo X=4,0 na equação:

Y  0,86X  0,89
Assim,

X  4,0  Y  0,86 4,0  0,89  4,33
O mesmo acontece com a nota 1,0:

X  1,0  Y  0,861,0  0,89  1,75
Como 4 pertence ao
intervalo [2,10], foi feita
uma
interpolação;
e
como 1 não pertence ao
intervalo [2,10], foi feita
uma extrapolação.
Números Índices
Disciplina de Análise Estatística
Prof. Hubert Chamone Gesser, Dr.
Retornar
ESTATÍSTICA
Os números índices permitem a análise de uma série histórica.
ESTATÍSTICA
Fonte: http://jeremiascartoons.blogspot.com.br/2013_03_01_archive.html
ESTATÍSTICA
INTRODUÇÃO
Um jornal, por ocasião de um pleito eleitoral, publicou uma
tabela com os resultados da apuração na região:
ESTATÍSTICA
INTRODUÇÃO
Confeccionando uma nova tabela, com números relativos, obtemos:
ESTATÍSTICA
INTRODUÇÃO
Somos levados a concluir, de imediato, que a cidade E foi a
que apresentou maior índice de votos brancos.
2,36% dos votos da CIDADE E são brancos
Não são poucas as situações em que, para a descrição ou
análise de um fenômeno quantitativo, o emprego dos
números relativos revela-se mais pertinente do que o dos
números absolutos.
ESTATÍSTICA
NÚMEROS ÍNDICES
Consideremos a tabela abaixo, relativa às matrículas efetivadas em
certo estabelecimento de ensino durante o período de 1989 a 1994:
ESTATÍSTICA
NÚMEROS ÍNDICES
A vantagem dos números-índices é permitir uma rápida
avaliação da variação relativa (percentual) sofrida pelo
número de matrículas.
Número-índice, ou, simplesmente, índice é a relação
entre dois estados de uma variável ou de um grupo
de variáveis, suscetível de variar no tempo ou no
espaço (ou de grupo de indivíduos para grupo de
indivíduos).
ESTATÍSTICA
RELATIVO DE PREÇOS
Quando queremos analisar a variação no preço (ou na
quantidade ou no valor) de um só bem, basta expressar tal
variação em termos percentuais, obtendo o que denominamos
relativo de preços (de quantidade ou de valor).
po : preço na época base; 
pt

 po,t  100
po
pt : preço na época atual. 

ESTATÍSTICA
RELATIVOS DE QUANTIDADE E DE VALOR
Do mesmo modo, obtemos:
qt
qo,t  100
qo
relativo de
quantidade
vt
vo,t  100
vo
relativo de
valor
ESTATÍSTICA
ELOS DE RELATIVOS
Vários relativos formam elos quando cada um deles é calculado
tomando como base o ano anterior; são os relativos de base
móvel.
Assim, se um bem
apresentou, no período
de 1991 a 1994,
respectivamente os
preços de R$240,
R$300, R$360 e R$540,
os elos relativos são:
ESTATÍSTICA
RELATIVOS EM CADEIA
O relativo em cadeia é o índice de base fixa: todos os relativos
são calculados tomando-se uma determinada época como base.
Utilizando o
exemplo anterior, e
considerando 1991
como ano-base,
obtemos:
ESTATÍSTICA
RELATIVOS EM CADEIA
O gráfico mostra a evolução do preço do bem em questão:
ESTATÍSTICA
ÍNDICES AGREGATIVOS
Temos como exemplos os índices de preços:
Índice de custo de vida
IPC – Índice de Preços ao Consumidor (IBGE)
ICB – Índice da Cesta Básica
IGP – Índice Geral de Preços
IPC – FIPE
ESTATÍSTICA
DEFLACIONAMENTO DE DADOS
Sabemos que os aumentos de preços implicam baixas no poder
de compra ou no valor da moeda. Por isso mesmo, a manutenção
do poder de compra dos salários é um problema que muito
preocupa os assalariados de países onde o valor da moeda está
continuamente se deteriorando.
Assim, embora os salários nominais estejam aumentando, os
salários reais podem estar diminuindo, devido ao aumento do
custo de vida e redução do poder aquisitivo.
Daí a importância dos índices de preços.
ESTATÍSTICA
DEFLACIONAMENTO DE DADOS
Para
determinarmos
os salários
reais (SR), também
denominados salários deflacionados, dividimos os salários
nominais de várias épocas (St) pelo índice de preços das épocas
correspondentes (IPt) e multiplicando o resultado por 100:
St
SR 
100
IPt
Esse processo é chamado deflacionamento de salários e o índice
de preços usado é chamado deflator.
ESTATÍSTICA
Os números índices são utilizados em relatórios gerenciais.
Fonte Bibliográfica

BARBETA, P. A. Estatística Aplicada às Ciências Sociais. 5.ed.
Florianópolis: UFSC, 2006.

BRUNI, A. L. Estatística Aplicada à Gestão Empresarial. 1.ed. São
Paulo; Atlas, 2010.

BRUNI, A. L. Excel Aplicado à Gestão Empresarial. 1.ed. São Paulo;
Atlas, 2010.

CRESPO, A. A. Estatística Fácil. 19.ed. São Paulo; Saraiva, 2009.

LEVIN, J. Estatística Aplicada às Ciências Humanas. 7.ed. São Paulo:
Harbra, 2007.

SPIEGEL, M. R. Estatística. 8.ed. São Paulo: Makron Books, 2006.

STEVENSON, W. J. Estatística Aplicada à Administração. São Paulo:
Harbra, 2007.
The Wrap-up
A little knowledge of statistic helps
you understand a lot about the
information which is presented to you.
Retornar