1.5 Estatísticas Amostrais

Download Report

Transcript 1.5 Estatísticas Amostrais

Universidade Federal do Pará
Instituto de Tecnologia
Estatística Aplicada I
Prof. Dr. Jorge Teófilo de Barros Lopes
Campus de Tucuruí – CTUC
Curso de Engenharia Mecânica
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
Universidade Federal do Pará
Instituto de Tecnologia
Capítulo I
Estatística Descritiva
Campus de Tucuruí – CTUC
Curso de Engenharia Mecânica
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
I - Estatística Descritiva

Introdução

Conceitos e definições

Classificação dos dados

Caracterização e apresentação dos dados

Estatísticas amostrais

Outras apresentações gráficas de dados

Regressão linear
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
I - Estatística Descritiva

Introdução

Conceitos e definições

Classificação dos dados

Caracterização e apresentação dos dados

Estatísticas amostrais

Outras apresentações gráficas de dados

Regressão linear
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.1 Introdução
 ESTATÍSTICA: É a disciplina que objetiva estudar os
métodos científicos para a coleta, organização, resumo,
apresentação e análise de dados, bem como obter
conclusões válidas e tomar decisões razoáveis baseadas
em tais análises.
 Técnicas Estatísticas: São as várias técnicas por meio
das quais é possível estudar conjuntos de dados e, a
partir de uma amostra (se necessária), tirar conclusões
válidas para conjuntos maiores (população).
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.1 Introdução
 De uma maneira geral, as técnicas estatísticas são
utilizadas em três etapas principais do trabalho de
pesquisa:
1. A coleta de dados, incluindo o planejamento do
trabalho e da pesquisa;
2. A apresentação dos dados coletados; e
3. A análise dos dados coletados, com a formulação
de conclusões e generalizações.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.1 Introdução
Coleta de dados
- Essa primeira etapa corresponde ao estabelecimento
do método de coleta de dados (questionário ou teste
ou ensaio de material) e elaboração dos
questionamentos; determinação das variáveis que
serão estudadas, de acordo com o interesse do
pesquisador; e o cálculo do tamanho da amostra, de
acordo com a natureza da pesquisa, do tempo e do
orçamento disponíveis.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.1 Introdução
Apresentação dos dados coletados
- A segunda etapa requer técnicas específicas para a
transformação dos dados numéricos em tabelas ou
gráficos (é a partir da organização dos dados
coletados que se poderá elaborar a interpretação).
Análise dos dados coletados
- Essa etapa é simultânea à anterior, pois durante a
própria organização dos dados já é possível ir
percebendo a tendência geral da pesquisa.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.1 Introdução
• No sentido de melhor esclarecer o significado da
análise e interpretação dos dados, deve-se estabelecer
uma distinção entre
Estatística Descritiva
e
Inferência Estatística.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.1 Introdução
 Estatística Descritiva: Objetiva sintetizar e representar de
uma forma compreensível a informação contida num
conjunto de dados.
• Como o próprio nome sugere, constitui-se num conjunto
de técnicas que objetivam descrever, analisar e interpretar
os dados numéricos de uma população ou amostra.
• Adquire importância quando o volume de dados for
significativo.
• Materializa-se na construção de tabelas e/ou gráficos ou
no cálculo de medidas que representem convenientemente
a informação contida nos dados.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.1 Introdução
 Inferência Estatística: Baseada na análise de um conjunto
limitado de dados (uma amostra), objetiva caracterizar o
todo a partir do qual tais dados foram obtidos (a população).
• Objetivo mais ambicioso que o da estatística descritiva.
• Os métodos e técnicas utilizados são mais sofisticados.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.1 Introdução
Figura 1.1- Diferença entre Estatística Descritiva e Inferência
Estatística (Silva e Carvalho, 2006).
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.1 Introdução
Figura 1.2- Diferença entre Estatística Descritiva e Inferência
Estatística (Silva e Carvalho, 2006).
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
I - Estatística Descritiva

Introdução

Conceitos e definições

Classificação dos dados

Caracterização e apresentação dos dados

Estatísticas amostrais

Outras apresentações gráficas de dados

Regressão linear
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.2 Conceitos e Definições
 População: É o conjunto de todos os elementos que contêm
uma certa característica que se deseja estudar.
• Como é comum a todos os elementos, esta característica
varia em quantidade ou qualidade.
• Uma população pode ter dimensão finita ou infinita.
 Amostra: É um subconjunto de dados que pertencem à
população. As amostras aleatórias são escolhidas por meio
de processos (técnicas de amostragem) que garantem que o
subconjunto obtido é representativo da população.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.2 Conceitos e Definições
 Principais motivos para o estudo da amostra:
1. População infinita;
2. Custo em termos de tempo ou de dinheiro que um
estudo em toda a população implicaria;
3. Obtenção de informação por meio de testes destrutivos,
no âmbito industrial;
4. Impossibilidade de acesso a todos os elementos da
população.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.2 Conceitos e Definições
 Fases do método de análise estatística:
• No âmbito da Estatística, o método de abordagem dos
problemas pode ser dividido em cinco fases:
13/04/2015
1.
Estabelecimento do objetivo da análise a efetuar (questões a
serem resolvidas) e definição das populações correspondentes;
2.
Concepção de um procedimento adequado para a seleção de
uma ou mais amostras (escolha das técnicas de amostragem a
utilizar).
3.
Coleta de dados.
4.
Análise dos dados (Estatística Descritiva).
5.
Estabelecimento de inferências a respeito da população
(Inferência Estatística)
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.2 Conceitos e Definições
 Fases do método de análise estatística:
Identificação do problema → Objetivo da análise
Planejamento da experiência → Técnicas de Amostragem
Coleta de dados
Análise exploratória dos dados → Estatística Descritiva
Análise e interpretação dos resultados → Inferência Estatística
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
I - Estatística Descritiva

Introdução

Conceitos e definições

Classificação dos dados

Caracterização e apresentação dos dados

Estatísticas amostrais

Outras apresentações gráficas de dados

Regressão linear
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados
 Iniciando o estudo:
• Não existe uma estratégia única para iniciar o estudo
descritivo, embora uma primeira recomendação seja
começar por uma exploração visual dos dados
levantados.
• Isso é necessário, pois podem ocorrer registros que não
se encaixam no padrão geral observado e, dessa forma,
a sua veracidade deve ser averiguada, pois podem tratarse de erros de observação, bem como do próprio registro
ou provenientes de alterações do fenômeno em estudo.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados
 Iniciando o estudo:
• Para se ter uma idéia mais concreta sobre os dados
levantados, deve-se recorrer às tabelas e/ou gráficos que
podem representar, de maneira sintética, as informações
sobre o comportamento de variáveis numéricas
levantadas.
• Embora estas análises já se encontrem disponíveis em
vários softwares e calculadoras programáveis, para uma
melhor interpretação das mesmas é conveniente
conhecer as técnicas utilizadas.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados
 Iniciando o estudo:
• Portanto, para se proceder um estudo descritivo, é importante:
- Ordenação dos dados – fase onde se começa a ter uma idéia a
respeito de algumas medidas de posição (média, mediana, quartis
etc.);
- Estatísticas amostrais – a partir de algumas medidas promove-se
um resumo dos dados levantados, relativamente à posição,
dispersão e forma;
- Agrupamento dos dados e representação gráfica – revela a forma
possível para a população em estudo e permite escolher a classe
de modelos que deve ser
explorada nas análises mais
sofisticadas.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados
 Dados brutos: Como primeiro resultado de uma pesquisa, obtêmse dados brutos, ou seja, um conjunto de números ainda sem
organização alguma.
 Rol: Os dados brutos são então ordenados de forma crescente ou
decrescente, com a indicação da freqüência de cada um, dando origem
ao chamado rol.
 Tabulação dos dados: Depois de elaborar o rol é preciso
determinar quantas faixas terá a tabela de freqüência. A fórmula de
Sturges é utilizada para estabelecer o número aproximado de classes
k  1  3 ,22  log n
onde: n = número de elementos da amostra (tamanho da amostra)
k = número de classes que a tabela de classes deverá contar.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados
• Observações: - k deverá ser no mínimo 3 e no máximo 20;
- Como a variável k é um número inteiro, ela
deverá ser aproximada para o maior inteiro (por
exemplo, se k ≈ 6,4, usa-se k = 7).
 Freqüência de classes: O passo seguinte é subdividir os dados
pelas classes ou categorias e determinar o número de indivíduos
pertencentes a cada uma, resultando nas freqüências de classes.
 Apresentação final dos dados (tabela completa): Com
base em todos os cálculos feitos anteriormente, pode-se fazer uma
nova tabela com todas as freqüências, as quais serão estudadas a
posteriori.
 Gráficos: A partir da tabela de freqüências, faz-se o desenho
gráfico, um recurso de visualização dos dados constantes na tabela.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados
 Os dados que constituem uma amostra podem ser de
quatro tipos, assim distribuídos:
• Qualitativos
- Nominal
- Ordinal
• Quantitativos
- Intervalar
- Absoluto
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados
a) Dados nominais: Quando cada um deles for identificado
pela atribuição de um nome que designa uma classe.
Neste caso, as classes devem ser:
a) Exaustivas - qualquer dado pertence a uma das classes;
b) Mutuamente exclusivas - cada dado pertence somente
a uma classe;
c) Não ordenáveis - não existe nenhum critério relevante
que permita estabelecer preferência por qualquer
classe em relação às restantes.
- Exemplo: Classificação das pessoas pela cor do cabelo
(preto, castanho, louro etc.).
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados
b) Dados ordinais: São semelhantes aos dados nominais;
contudo, nessa escala existe a possibilidade de se
estabelecer uma ordenação dos dados nas classes,
segundo algum critério relevante.
- Exemplo: Classificação de conceitos de avaliação na
disciplina em insuficiente, regular, bom e excelente.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados
c) Dados intervalares: No caso da escala intervalar, os
dados são diferenciados e ordenados por números
expressos em uma ordem cuja origem é arbitrária.
- Observação: Neste caso, pode-se atribuir um significado
à diferença entre esses números, mas não à razão entre
eles.
Por exemplo, o registro de temperaturas em ºC, em determinadas
horas de dias sucessivos. Se em três dias consecutivos a
temperatura atingir 5ºC, 10°C e 20ºC, não faz sentido dizer que o
terceiro dia esteve duas vezes mais quente que o segundo, pois se a
temperatura fosse expressa em outra escala, a razão entre os
valores registrados naqueles dias seria diferente.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados
d) Dados absolutos: Contrariamente ao que sucede com a
escala intervalar, a escala absoluta tem origem fixa (nesta
escala, o valor zero tem significado).
- Exemplo: Pesos de pessoas expressos em kg.
- Observações:
• Escala intervalar: temperatura de 0ºC não significa que não haja
temperatura.
• Escala absoluta: peso de 0 kg significa que não existe peso.
• Em conseqüência ao fato da origem ser fixa, a razão entre os dados
expressos numa escala absoluta passa a ter significado; uma pessoa
com 60 kg tem o dobro do peso de uma com 30 kg.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados
- Observação: Quando se trabalha com dados quantitativos,
é necessário que se faça a distinção entre os dados discretos
e os contínuos.
Os dados denominam-se discretos quando são valores de uma
variável aleatória discreta, que é a aquela que assume valores em
pontos da reta real (por exemplo, número de páginas em um livro:
1, 2, 3, 4, 5...).
Os dados são contínuos quando são valores de uma variável
aleatória contínua, que é aquela que pode assumir qualquer valor
em certo intervalo da reta real (por exemplo, o peso de
funcionários de uma fábrica: 60,5 kg; 60,52 kg; ...)
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados
 Arredondamento de dados: O arredondamento de um dado
estatístico deve obedecer as seguintes regras.
1. Arredondamento por falta: Quando o primeiro dígito, aquele situado
mais à esquerda entre os que irão ser eliminados, for igual ou menor que
quatro, não deverá ser alterado o dígito remanescente (ou seja, frações de
0,000... a 0,4999... são simplesmente eliminadas, arredondadas para
baixo).
Exemplos: 3, 49 ≈ 3;
2,43 ≈ 2,4;
1,734999 ≈ 1,73
Número a arredondar Arredondamento para Número arredondado
13/04/2015
11:10
12,489
Inteiros
12
12,733
Décimos
12,7
12,992
Centésimos
12,99
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados
2. Arredondamento por excesso: Quando o primeiro dígito após aquele que
será arredondado for maior ou igual a cinco seguido por dígitos maiores
que zero, o digito remanescente será acrescido de uma unidade (ou seja,
frações maiores de 0,500... até 0,999... são eliminadas, mas o algarismo a
ser arredondado aumenta 1 unidade, arredondadas para cima).
Exemplos: 3,688 ≈ 3,69; 5,6501 ≈ 5,7
Número a arredondar Arredondamento para Número arredondado
13/04/2015
11:10
15,504
Inteiros
16
15,561
Décimos
15,6
15,578
Centésimos
15,58
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados
3. Arredondamento de dígitos seguidos do cinco: Quando o dígito
situado mais à esquerda dos que serão eliminados for um cinco ou um
cinco seguido somente de zeros, o último dígito remanescente, se for
par, não se alterará, e se for impar será aumentado de uma unidade (ou
seja, se a fração a ser eliminada é exatamente 0,50000..., então o
algarismo a ser arredondado, só aumentará de 1 unidade caso torne-se
um algarismo par).
Exemplos: 3,5 ≈ 4; 6,5 ≈ 6; 5,6500 ≈ 5,6; 5,700 ≈ 5,8; 9,475 ≈ 9,48;
3,325 ≈ 3,32
Número a arredondar Arredondamento para Número arredondado
215,500
216,500
216,750
216,705
13/04/2015
11:10
Inteiro
Inteiro
Décimos
Centésimos
216
216
216,8
216,70
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados
- Observações:
1. Nunca se deve fazer arredondamentos sucessivos.
Exemplo: 17,3452 → 17,3 (correto)
17,3452 → 17,35 → 17,4 (incorreto)
2. Se for necessário um novo arredondamento, recomenda-se o retorno
aos dados originais.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados
 Algarismos significativos
Os algarismos significativos de um número são os dígitos diferentes de
zero, contados a partir da esquerda até o último dígito diferente de zero à
direita, caso não haja vírgula decimal, ou até o último dígito (zero ou não)
caso haja uma vírgula decimal.
Exemplos:
Algarismos
Números
Notação científica
significativos
3200
1,55
8,3400
32050
0,032
0,03200
13/04/2015
11:10
3,2 x 103
1,55 x 100
8,3400 x 100
3,205 x 104
3,2 x 10-2
3,200 x 10-2
2
3
5
4
2
4
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados
 Algarismos significativos:
• Todos os dígitos diferentes de zero são significativos.
Exemplos: 7,3; 32 e 210 possuem 2 algarismos significativos.
• Os zeros entre dígitos diferentes de zero são significativos
Exemplos: 303 e 1,03 possuem 3 algarismos significativos.
• Se existir uma vírgula decimal, todos os zeros à direita da vírgula
decimal são significativos
Exemplos: 1,000 e 33,30 possuem 4 algarismos significativos.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados
 Algarismos significativos:
• Valores medidos ou calculados: o número de algarismos significativos
de uma grandeza medida ou um valor calculado é uma indicação da
incerteza, ou seja, quanto mais algarismos significativos, menor a
incerteza no valor.
Exemplo:
O valor de uma grandeza medida com 3 algarismos significativos,
indica que o valor do 3º algarismo tem uma incerteza menor ± 0,5ºC.
Caso seja apresentada uma temperatura como 32ºC (2 significativos),
está indicado que a temperatura está entre 31,5 e 32,5ºC. Caso ela seja
apresentada como 32,5ºC (3 significativos), está indicado que a
temperatura está entre 32,45 e 32,55ºC.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados
 Algarismos significativos:
• Números inteiros que são resultados experimentais, seguem as regras
anteriores.
Exemplo: a pressão em uma caldeira é 6 atm, possui 1 algarismo
significativo.
• Números inteiros que descrevem o número de objetos discretos
possuem precisão mínima.
Exemplo: 5 dias = 5,0000000... dias.
• Números inteiros que são parte de uma expressão física possuem
precisão infinita.
Exemplo: o 2 na equação do perímetro do círculo 2πR, possui uma
precisão infinita uma vez que por definição o diâmetro é 2 vezes o raio.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados
- Observações:
• Na adição e na subtração faz-se a operação normalmente e no final
reduz-se o resultado, usando os critérios de arredondamento, para o
número de casas decimais da grandeza menos precisa.
Exemplos:
12441 + 57,91 + 1,987 + 0,0031 + 119,20 = 12620,1001 = 12620
12441,2  7856,32 = 4584,88 = 4584,9
• Na multiplicação e na divisão o resultado deverá ter igual número de
algarismos (ou um algarismo a mais) que a grandeza com menor
quantidade de algarismos significativos que participa da operação.
Exemplos:
12,46 x 39,83 = 496,2818 = 496,28
803,407 / 13,1 = 61,328 = 61,33
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.3 Classificação dos Dados
- Observações:
• Nas operações de potenciação e radiciação o resultado deverá ter o
mesmo número de algarismos significativos da base (potenciação) ou
do radicando (radiciação).
Exemplos: (1,52 x 103)2 = 2,31 x 106
(0,75 x 104)1/2 = 0,87 x 102
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
I - Estatística Descritiva

Introdução

Conceitos e definições

Classificação dos dados

Caracterização e apresentação dos dados

Estatísticas amostrais

Outras apresentações gráficas de dados

Regressão linear
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Tabela de freqüências:
• Devido à necessidade das categorias estarem
ordenadas, somente se pode falar de freqüências
acumuladas quando os dados estão em escalas ordinais,
intervalar ou absoluta.
• A representação tabular com todos os tipos de
freqüências é mostrada a seguir:
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Tabela de freqüências:
a) Freqüência absoluta (ni): O número de dados contidos
numa classe ou categoria qualquer i (i = 1,..., k) de
um conjunto de dados designa-se por freqüência
absoluta da classe ou categoria i.
• Denotando-se por ni tal freqüência e admitindo que
as categorias especificadas contêm todos os dados,
o número total de dados (n) é calculado por :
k
n   ni
1 1
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Tabela de freqüências:
b) Freqüência relativa (fi): O número total de dados que
pertencem a uma classe ou categoria qualquer i,
quando expressos como uma proporção do número
total de dados, designa-se por freqüência relativa da
classe ou categoria i e é dada por
ni
fi 
n
• As freqüências relativas são muitas vezes definidas
em termos percentuais.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Tabela de freqüências:
c) Freqüência absoluta acumulada (Ni): Representa para
cada classe ou categoria i, a freqüência absoluta de
dados que pertencem à classe ou às classes anteriores.
d) Freqüência relativa acumulada (Fi): Representa para
cada classe categoria i, a freqüência relativa de dados
que pertencem à classe ou às classes anteriores.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Tabela de freqüências:
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Gráficos estatísticos
• Uma vez elaborada a tabela de freqüências, segue-se o
desenho do gráfico, um recurso de visualização dos
dados constantes na tabela.
• Os tipos de gráficos mais comuns são: histograma;
polígono de freqüência, setograma e ogiva de Galton.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Gráficos estatísticos
- Histograma: Este tipo de gráfico é utilizado para
representar as freqüências absolutas (ni) em relação à
sua classe, e é assim construído:
1. No eixo das abscissas marcam-se, em escala, as classes dos
dados;
2. No eixo das ordenadas, marcam-se as freqüências das classes;
3. Faz-se a correspondência entre cada intervalo no eixo das
classes com um valor no eixo das freqüências, formando um
desenho de colunas paralelas.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Gráficos estatísticos
- Polígono de freqüência: Utilizado para indicar o ponto médio
ou representante de classe em suas respectivas freqüências
absolutas; normalmente, é construído sobre o histograma, da
seguinte forma:
13/04/2015
1.
No eixo das abscissas, coloca-se o ponto médio de
cada intervalo de classe;
2.
No eixo das ordenadas, permanecem as freqüências
absolutas das classes (ni) ;
3.
Ligam-se os pontos médios por segmentos de reta;
4.
Para completar o polígono, acrescenta-se um ponto
médio com freqüência zero em cada uma das
extremidades da escala horizontal.
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Gráficos estatísticos
- Histograma e Polígono de freqüência:
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Gráficos estatísticos
- Histograma
- Polígono de freqüência:
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Gráficos estatísticos
- Gráfico em setores (Setograma): Também conhecido como
gráfico de pizza, é utilizado para representar valores relativos (%);
é construído da seguinte forma:
1.
Faz-se um círculo;
2.
Cada setor é regido pela
fórmula:
º Setori 
3.
13/04/2015
11:10
360º ni
n
No círculo, distribui-se os
valores das freqüências
percentuais
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Gráficos estatísticos
- Ogiva de Galton: Este tipo de gráfico é utilizada para
representar as freqüências acumuladas de uma
distribuição; é construído da seguinte forma:
1. No eixo das abscissas coloca-se as classes dos dados, tal como
no histograma;
2. No eixo das ordenadas, escreve-se uma das freqüências
acumuladas, marcando o ponto com os limites superiores (Li) de
cada classe; inicia-se com a freqüência zero e com limite
inferior da 1ª classe.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Gráficos estatísticos
- Ogiva de Galton:
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Gráficos estatísticos
- Gráfico linear: É o tipo
de gráfico que apresenta
os dados estatísticos por
meio de uma linha
poligonal. Os pontos da
polígono são obtidos pelas
informações contidas em
cada linha da tabela, e
marcados
no
plano
utilizando
o
sistema
cartesiano. São utilizados
para representar séries
cronológicas.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Gráficos estatísticos
- Gráfico de colunas: É
o tipo de gráfico que
apresenta
os
dados
estatísticos por meio de
retângulos
(colunas)
dispostas em posições
vertical.
Todos
os
retângulos possuem a
mesma base e a altura
proporcional aos dados.
Podem ser utilizados para
representar qualquer série
estatística.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Gráficos estatísticos
- Gráfico de colunas:
Este tipo de gráfico é
semelhante ao de colunas,
onde
os
retângulos
(barras) estão dispostos
horizontalmente.
É
utilizado para legendas
longas, em todas as séries.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Dados Qualitativos:
• Exemplo: Em uma amostra constituída de 120 peças, constatouse que 100 não tinham qualquer defeito, 15 tinham defeitos
recuperáveis e 5 apresentavam defeitos irrecuperáveis. Representar
em uma tabela, e também graficamente, as freqüências (absolutas e
relativas) dos dados que constituem essa amostra:
13/04/2015
Categoria de peças
Freqüência absoluta
(ni)
Freqüência relativa
(fi)
Sem defeitos
Recuperáveis
irrecuperáveis
100
15
5
83,3%
12,5%
4,2%
TOTAL
120
100%
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Dados Qualitativos:
Gráfico em Setores
4,2%
12,5%
Sem defeitos
Recuperáveis
irrecuperáveis
83,3%
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Dados Quantitativos:
• Exemplo: Em um estudo realizado com o objetivo de
caracterizar o comportamento dos clientes de um
supermercado, analisou-se o número de ocupantes por
veículo para 1000 veículos que entraram no
estacionamento do referido supermercado, em um
sábado. Os resultados encontram-se resumidos na
tabela seguinte:
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Dados Quantitativos:
Nº de ocupantes
por veículo
(xi)
Freqüência
absoluta
(ni)
Freqüência
relativa
(fi)
1
2
3
4
5
6
7
103
147
248
197
152
100
53
10,3%
14,7%
24,8%
19,7%
15,2%
10,0%
5,3%
TOTAL
1000
100%
13/04/2015
11:10
Freqüência
Freqüência
absoluta acumulada relativa acumulada
(Ni)
(Fi)
103
250
498
695
847
947
1000
10,3%
25,0%
49,8%
69,5%
84,7%
94,7%
100,0%
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Dados Quantitativos:
Gráfico em colunas
300
250
200
n i 150
100
50
0
1
2
3
4
5
6
7
Nº ocupantes / veículo
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Dados Quantitativos:
• Distribuições agrupadas: Essas distribuições são úteis
quando existe um grande número de dados relativos a
uma variável contínua, cujos valores observados são
muito próximos uns dos outros.
- A freqüência de cada classe é o número de observações que ela
contém.
- No exemplo anterior, os dados observados correspondem a uma
variável discreta; para o caso de dados relativos uma variável
contínua existem algumas diferenças.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Dados Quantitativos:
• Exemplo: O conjunto de dados baixo representa o
peso, em gramas, do conteúdo de uma série de 100
garrafas que, no decurso de um teste, saíram de uma
linha de enchimento automático:
302,25; 299,20; 300,24; 297,22; 298,35; 303,76;
298,65; 299,38; 300,36; 299,16; 300,86; 299,83;
302,52; 300,12; 301,81; 297,99; 299,23; 298,73;
303,07; 299,07; 297,83; ... ; 300,80
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Dados Quantitativos:
• No conjunto de dados mostrado não existe praticamente
repetição de valores; logo, não é vantagem se utilizar os
dados agrupados numa tabela de freqüências, pois a
mesma teria tantas linhas quanto o número de dados.
• No entanto, a tabela de freqüências pode ser construída
se os dados forem agrupados por classes:
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
Classes
Freqüência
absoluta
(ni)
Freqüência
relativa (%)
(fi)
Freqüência
absoluta
acumulada
(Ni)
Freqüência
relativa
acumulada (%)
(Fi)
[297,00 ; 298,00[
[298,00 ; 299,00[
[299,00 ; 300,00[
[300,00 ; 301,00[
[301,00 ; 302,00[
[302,00 ; 303,00[
[303,00 ; 304,00[
[304,00 ; 305,00[
[305,00 ; 306,00[
8
21
28
15
11
10
5
1
1
8
21
28
15
11
10
5
1
1
8
29
57
72
83
93
98
99
100
8
29
57
72
83
93
98
99
100
TOTAL
100
100%
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.4 Caracterização e Apresentação dos Dados
 Dados Quantitativos:
Histograma
30
25
20
f i 15
10
5
0
[297,00 ;
298,00[
[298,00 ;
299,00[
[299,00 ;
300,00[
[300.00 ;
301,00[
[301,00 ;
302,00[
[302,00 ;
303,00[
[303,00 ;
304,00[
[304,00 ;
305,00[
[305,00 ;
306,00[
Peso (kg)
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
I - Estatística Descritiva

Introdução

Conceitos e definições

Classificação dos dados

Caracterização e apresentação dos dados

Estatísticas amostrais

Outras apresentações gráficas de dados

Regressão linear
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
 Nas seções anteriores foi visto a sintetização de dos dados
sob a forma de tabelas, gráficos e distribuição de
freqüências.
 O cálculo de estatísticas amostrais é uma forma mais
sintética de descrever um conjunto de dados, ou seja,
possibilita representar um conjunto de dados relativos à
observação de determinado fenômeno de forma reduzida.
 As estatísticas amostrais são calculadas com base nos
dados, a partir das quais é possível descrever globalmente
o conjunto de valores que os referidos dados tomam.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
 As estatísticas amostrais ou medidas estatísticas são
divididas em três grupos:
a) Medidas de posição ou de tendência central:
• Média aritmética, média geométrica, média harmônica,
mediana, quartis, decis, percentis e moda.
b) Medidas de dispersão:
• Amplitude total, desvio médio, variância, desvio
padrão, amplitude interquartílica e coeficiente de
variação.
c) Medidas de forma:
• Medidas de assimetria e medidas de curtose.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
• Essas medidas nos orientam quanto à posição da
distribuição no eixo x (eixo dos números reais);
• Possibilitam comparações de séries de dados entre si
pelo confronto desses números.
• São chamadas de medidas de tendência central, pelo
fato de representarem os fenômenos pelos seus valores
médios, em torno dos quais tendem a concentrar-se os
dados.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.1) Média aritmética:
• Para um conjunto de n dados de xi (i = 1,2,..., n) a
média aritmética simples ou média amostral,
representada por x é definida pela expressão:
n
x
13/04/2015
11:10
x
i 1
i
(dados não agrupados)
n
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.1) Média aritmética:
• Exemplo: Determinar a média aritmética simples (média
aritmética amostral) dos dados mostrados abaixo:
2, 1, 3, 3, 2, 3, 7, 5, 5, 2, 1, 3, 1, 1, 4
n
x
x
i 1
i

n
2  1 3 3 2 37  5  5  2 1 3 1 1 4
x

15
x  2 ,87
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.1) Média aritmética:
• Quando os dados estiverem agrupados numa
distribuição de freqüência usa-se a média aritmética
dos valores xi ponderadas pelas respectivas
freqüências absolutas ni, assim:
n
x
13/04/2015
11:10
n x
i
i 1
n
i
(dados agrupados)
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.1) Média aritmética:
• Exemplo (dados agrupados): Determinar a média
aritmética simples (média aritmética amostral) da
distribuição dada abaixo:
13/04/2015
11:10
xi
1
2
3
4
5
7
ni
4
3
4
1
2
1
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.1) Média aritmética:
• Exemplo (dados agrupados):
n
x
x n
i 1
n
x  2 ,87
13/04/2015
11:10
i
i

( 1  4 )  ...  ( 7  1 ) 43

15
15
xi
ni
x ini
1
2
3
4
5
7
4
3
4
1
2
1
4
6
12
4
10
7
Σ 15
43
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição
a.1) Média aritmética:
• No caso da variável ser contínua, visto que se
perdeu os valores concretos do conjunto (ficaram
afetos a uma determinada classe) não se pode
calcular a média amostral diretamente dos valores
dos dados.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.1) Média aritmética:
• Deste modo, à cada classe vai ser atribuído um representante
(xi), e a média amostral será calculada por meio desses
representantes:
k
x
n x
i
i 1
i
(dados agrupados em classes)
n
onde k é o número de classes do agrupamento, ni é a
freqüência absoluta da classe i e xi é o ponto médio da classe
i, o qual é considerado como elemento representativo da
classe.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.1) Média aritmética:
• Exemplo (dados agrupados em classes):
Determinar a média da distribuição a seguir, a
qual representa o peso, em gramas, do conteúdo
de uma série de 100 garrafas que, no decurso de
um teste, saíram de uma linha de enchimento
automático (exemplo anterior):
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.1) Média aritmética:
• Exemplo (dados agrupados em classes):
13/04/2015
11:10
Classes
ni
xi
xini
[297,00 ; 298,00[
[298,00 ; 299,00[
[299,00 ; 300,00[
[300,00 ; 301,00[
[301,00 ; 302,00[
[302,00 ; 303,00[
[303,00 ; 304,00[
[304,00 ; 305,00[
[305,00 ; 306,00[
8
21
28
15
11
10
5
1
1
297,5
298,5
299,5
300.5
301,5
302,5
303,5
304,5
305,5
2380,0
6268,5
8386,0
4507,5
3316,5
3025,0
1517,5
304,5
305,5
Σ
100
9
x
n x
i 1
i
i
n
30011,0
x
100
x  300,11
30011,0
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.1) Média aritmética (Ponderada)
• Às vezes, associam-se os números x1, x2, ..., xk a certos
fatores de ponderação ou pesos w1, w2, ... , wk que
dependem do significado ou importância atribuída aos
mesmos. Nesse caso
k
w x
x
w
i 1
i
i
i
w1 x1  w2 x2  ... wk xk

w1  w2  ... wk
é denominada de média aritmética ponderada.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.1) Média aritmética (Ponderada)
• Exemplo: Em um curso, a avaliação final tem peso 3 e as
parciais peso 1; a nota média de um estudante que obtenha
nota 8,5 na avaliação final e 7,0 e 9,0 nas provas parciais,
será:
3
x
w x
i 1
3
w
i 1
13/04/2015
11:10
i
i

( 1  7 ,0 )  ( 1  9 ,0 )  ( 3  8 ,5 ) 41,5

 8 ,3
1 1 3
5
i
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.2) Média geométrica: A média geométrica G (ou xG ) de
um conjunto de n números x1, x2, ..., xn é a raiz de
ordem n do produto desses números:
G  n x1  x2  ... xn
- Exemplo: A média geométrica dos números 2, 4 e 8:
G  3 2  4  8  3 64  4
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.2) Média geométrica (dados agrupados): Se os elementos
x1, x2, ..., xn ocorrem com as freqüências n1, n2,..., nk,
sendo n1+n2+...+nk = n a freqüência total, a média
geométrica G desses elementos será deduzida como:
G  n x1 x1 ...x1 x 2 x 2 ...x 2 xk xk xk  n x1n1  x 2n2 ... x knk
n1 vezes
13/04/2015
11:10
n2 vezes
nk vezes
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.3) Média harmônica: A média harmônica H (ou x H ) de
um conjunto de n elementos x1, x2, ..., xn é a
recíproca da média aritmética da recíproca dos
elementos:
H
1
1 n 1

n j 1 x j

n
n
1
x
j 1
j
- Exemplo: A média harmônica dos números 2, 4 e 8:
H
n
n
j 1
13/04/2015
11:10
1
x
j

3
3
  3 ,43
1 1 1 7
 
2 4 8 8
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.4) Mediana: Para os dados colocados em ordem crescente,
mediana (md, Me ou ~x ) é o valor que divide a amostra,
ou população, em duas partes iguais. Assim:
0%
50%
100%
~
x
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.4) Mediana (série de elementos não agrupados):
• Considerando que os dados que integram a
amostra são colocados em ordem crescente,
formando um vetor (x1, x2, ..., xn) - amostra
ordenada -, a mediana amostral é definida como
segue:
x  x n 1
n ímpar
~

2


x n  x n 2
~
2
2
x


2
13/04/2015
11:10
n par
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.4) Mediana (série de elementos não agrupados):
• Exemplo: Para as distribuições abaixo, determinar as
respectivas medianas:
8, 5, 15,11, 4, 1, 7, 2, 9
8, 5, 15,11, 4, 1, 7, 2, 9, 3
Ordenando:
Ordenando:
1, 2, 4, 5, 7, 8, 9, 11,15
1, 2, 3, 4, 5, 7, 8, 9, 11,15
Como n é ímpar, então:
Como n é par, então:
~
x  x n 1  x5  7
2
13/04/2015
11:10
x n  x n 2
~
x
2
2
2

x 5  x6 5  7

6
2
2
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.4) Mediana (variáveis discretas, dados agrupados em
tabela de distribuição de freqüência):
• Exemplo: Para a distribuição abaixo, determinar a mediana:
13/04/2015
11:10
xi
ni
Ni
1
2
3
4
1
3
5
2
1
4
9
11
Σ
11
x será o
n = 11 (ímpar), logo ~
elemento de ordem (n+1)/2, ou
seja, (11+1)/2 = 6º elemento.
contém o 6º
elemento
Da
coluna
da
freqüência
acumulada crescente, encontra-se
o valor xi correspondente à classe
que contém a ordem calculada,
assim: ~
x = 3.
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.4) Mediana (variáveis discretas, dados agrupados em
tabela de distribuição de freqüência):
• Exemplo: Para a distribuição abaixo, determinar a mediana:
13/04/2015
11:10
xi
ni
Ni
82
85
87
89
90
9
12
11
6
4
9
21
32
38
42
Σ
42
21º
22º
x será a média
n = 42, é par, logo ~
entre os elemento de ordem n/2 e
(n/2)+1, ou seja, 21º e 22º
elementos.
Como no exemplo anterior,
identificam-se os elementos de
ordem 21 e 22 pela Ni, ou seja, 85
e 87, assim:
85  87
~
x
 86
2
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.4) Mediana (variáveis discretas, dados agrupados em
tabela de distribuição de freqüência):
• Exemplo: Para a distribuição abaixo, determinar a mediana:
x será a média
n = 42, é par, logo ~
xi
ni
Ni
entre os elemento de ordem n/2 e
13/04/2015
11:10
82
85
87
89
90
5
10
15
8
4
Σ
42
5
15
30
38
42
(n/2)+1, ou seja, 21º e 22º
elementos.
21º e 22º
Como no exemplo anterior,
identificam-se os elementos de
ordem 21 e 22 pela Ni, ou seja, 87
e 87, assim:
87  87
~
x
 87
2
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.4) Mediana (variáveis contínuas com os dados divididos em
classes, tabela de distribuição de freqüência):
• Para variáveis contínuas, identifica-se a classe que contém a
mediana (n/2), denominada classe Md (como a variável é
contínua, não interessa se n é par ou ímpar); o valor
aproximado para a mediana será calculado pela equação:
~
x  l Md
n

  N Md  1  a Md
0 ,5  FMd  1
2


 l Md 
a Md
n Md
f Md
onde: NMd-1 é a freqüência absoluta acumulada da classe antes da classe
mediana, n a dimensão da amostra e lMd , aMd e nMd são, respectivamente,
o limite inferior, a amplitude e a freqüência absoluta da classe mediana.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.4) Mediana (variáveis contínuas com os dados divididos em
classes, tabela de distribuição de freqüência):
• Exemplo: Dada a distribuição amostral, calcular a mediana:
Classes
ni
Ni
35
45
55
65
75
85
5
12
18
14
6
3
5
17
35
49
55
58
45
55
65
75
85
95
Σ
13/04/2015
11:10
classe Md
58
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.4) Mediana (variáveis contínuas com os dados divididos em
classes, tabela de distribuição de freqüência):
• Exemplo:
1º Passo: Calcula-se n/2; como n=58, então 58/2=29º.
2º Passo: Identifica-se a classe Md pela Ni (classe Md=3ª).
3º Passo: Aplica-se a fórmula:
Neste caso li = 55, n = 58, Ni-1 = 17, ai = 10, ni = 18; logo:
n

 58

  N i  1  ai
  17  10
2
  55   2
  61,67
~
x  li  
ni
18
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.5) Quartis:
• Como já visto anteriormente, a mediana é a
medida de posição que divide um conjunto de
dados em duas partes iguais;
• Os quartis dividem um conjunto de dados em
quatro partes iguais, assim:
50%
25%
Q1
13/04/2015
11:10
75%
Q2
Q3
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.5) Quartis:
50%
25%
Q1
75%
Q2
Q3
Q1 = 1º quartil, deixa 25% dos elementos;
Q2 = 2º quartil, coincide com a mediana, deixa 50% dos
elementos;
Q3 = 3º quartil, deixa 75% dos elementos.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.5) Quartis (série de elementos não agrupados):
• A determinação de Qk (k = 1, 2 e 3), segue a fórmula:
 n 1
Qk  k 

 4 
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.5) Quartis (série de elementos não agrupados):
• Exemplo: Determine o 1º e o 3º quartis da série 185, 196, 207,
305, 574, 597, 612. E da série 185, 196, 207, 305, 574, 597 ?
7 1
Q1  1
  2º elem ento 196
 4 
7 1
Q3  3
  6º elem ento 597
 4 
 6 1
Q1  1
  1,75º elem ento 185 0 ,75( 196  185)  193,3
 4 
 6 1
Q3  3
  5 ,25º elem ento 574  0 ,25( 597  574 )  579,8
4


13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.5) Quartis (variáveis contínuas com os dados divididos em
classes, tabela de distribuição de freqüência):
• A determinação de Qk (k = 1, 2 e 3), segue os passos:
- 1º Passo: Calcula-se a ordem kn/4;
- 2º Passo: Identifica-se a classe Qk pela freqüência acumulada N;
- 3º Passo: Aplica-se a fórmula:
Qk  l Qk
13/04/2015
11:10
 kn

 N Qk  1 

 4


 a Qk
nQk
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição
a.5) Quartis (variáveis contínuas com os dados divididos em
classes, tabela de distribuição de freqüência):
• Exemplo: Dada a distribuição amostral, determinar Q1 e Q3:
Classes
ni
Ni
35
45
55
65
75
85
5
12
18
14
6
3
5
17
35
49
55
58
45
55
65
75
85
95
Σ
13/04/2015
11:10
classe Q1
classe Q3
58
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.5) Quartis (variáveis contínuas com os dados divididos em
classes, tabela de distribuição de freqüência):
• Exemplo: Para Q1.
1º Passo: Calcula-se n/4; como n=58, então 58/4=14,5º.
2º Passo: Identifica-se a classe Q1 pela Ni (classe Q1 =2ª).
3º Passo: Aplica-se a fórmula:
Neste caso lQ1 = 45, n = 58, NQ1-1 = 5, aQ1 = 10, nQ1 = 12; logo:
Q1  l Q1
13/04/2015
11:10
 1n

 N Q1  1 

14,5  5   10  52,92
 4


 a Q1  45 
nQ1
12
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.5) Quartis (variáveis contínuas com os dados divididos em
classes, tabela de distribuição de freqüência):
• Exemplo: Para Q3.
1º Passo: Calcula-se 3n/4; como n = 58, então 58/4 = 43,5º.
2º Passo: Identifica-se a classe Q3 pela NQ3 (classe Q3 = 4ª).
3º Passo: Aplica-se a fórmula:
Neste caso lQ3 = 65, n = 58, NQ3 -1 = 35, aQ3 = 10, nQ3 = 14; logo:
Q 3  l Q3
13/04/2015
11:10
 3n

 N Q3  1 

43,5  35  10  71,07
 4


 a Q3  65 
nQ3
14
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.5) Quartis (variáveis contínuas com os dados divididos em
classes, tabela de distribuição de freqüência):
• Exemplo: Diante desses resultados, pode-se afirmar que,
nesta distribuição, tem-se:
25%
35
52,92
25%
61,67
25%
25%
71,07
95
ou seja: O valor de 52,92 deixa 25% dos elementos;
O valor de 61,67 deixa 50% dos elementos;
O valor de 71,07 deixa 75% dos elementos.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.6) Decis:
• Os decis dividem um conjunto de dados em dez
partes iguais, assim:
10% 20% 30% 40% 50% 60% 70% 80% 90%
D1
13/04/2015
11:10
D2
D3
D4
D5
D6
D7
D8
D9
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.6) Decis:
D1 = 1º decil, deixa 10% dos elementos da série;
D2 = 2º decil, deixa 12% dos elementos da série;
D5 = 5º decil, coincide com a mediana, deixa 50% dos
elementos da série;
D6 = 6º decil, deixa 60% dos elementos da série;
D7 = 7º decil, deixa 70% dos elementos da série;
D8 = 8º decil, deixa 80% dos elementos da série;
D9 = 9º decil, deixa 90% dos elementos da série.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.6) Decis (série de elementos não agrupados:
• A determinação de Dk (k = 1, 2, ..., 9), segue a fórmula:
 n 1
Dk  k 

 10 
• Exemplo: Determine o 5º e o 6º decis da série 185, 196, 207,
305, 574, 597, 612.
7  1
D1  5
  4º elem ento 305
10


7 1
D6  6 
  4 ,8º elem ento 520,2
 10 
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.6) Decis (variáveis contínuas com os dados divididos em
classes, tabela de distribuição de freqüência):
• A determinação de Dk (k = 1, 2, ..., 9), para o caso de
variáveis contínuas com os dados divididos em classes,
segue os passos:
- 1º Passo: Calcula-se a ordem kn/10;
- 2º Passo: Identifica-se a classe Dk pela freqüência acumulada N;
- 3º Passo: Aplica-se a fórmula:
Dk  l Dk
13/04/2015
11:10
 kn

 N Dk  1 

 10


 a Dk
n Dk
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.7) Percentis:
• Os percentis dividem um conjunto de dados em
cem partes iguais, assim:
1%
P1
13/04/2015
11:10
2% 3% . . . 50% . . . 97%
P2
P3
P50
98% 99%
P97
P98
P99
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.7) Percentis:
P1 = 1º percentil, deixa 1% dos elementos;
P2 = 2º percentil, deixa 2% dos elementos.
P50 = 50º percentil, coincide com a mediana, deixa 50% dos
elementos;
P99 = 99º percentil, deixa 99% dos elementos.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.7) Percentis (série de elementos não agrupados):
• A determinação de Pk (k = 1, 2, ..., 99) para uma série de
elementos não agrupados, segue a fórmula:
 n 1
Pk  k 

 100 
• Exemplo: Determine o 50º e o 60º percentis da série 185, 196,
207, 305, 574, 597, 612.
7  1
P50  50
  4º elem ento 305
100


7  1
P60  60
  4 ,8º elem ento 520,2
 100 
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.7) Percentis (variáveis contínuas com os dados divididos em
classes, tabela de distribuição de freqüência):
• A determinação de Pk (k = 1, 2, ..., 99), para o caso de
variáveis contínuas com os dados divididos em classes,
segue os passos:
- 1º Passo: Calcula-se a ordem kn/100;
- 2º Passo: Identifica-se a classe Pk pela freqüência acumulada N;
- 3º Passo: Aplica-se a fórmula:
Pk  l Pk
13/04/2015
11:10
 kn

 N Pk  1 

100
 a

Pk
n Pk
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.7) Exemplo (decil e percentil): Determinar o 4º decil e o 72º
percentil da seguinte distribuição:
Classes
ni
Ni
35
45
55
65
75
85
5
12
18
14
6
3
5
17
35
49
55
58
45
55
65
75
85
95
Σ
13/04/2015
11:10
58
Cálculo de D4
classe D4
1º Passo:
kn 4  58

 23,2 o
10
10
2º Passo:
l D4  55; N D4  1  17 ; n  58;
a D4  10; nD4  18
classe P72
3º Passo:
 4  58

 17 

10
  10  55 ,34
D4  55  
18
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.7) Exemplo (decil e percentil): Determinar o 4º decil e o 72º
percentil da seguinte distribuição:
Classes
ni
Ni
35
45
55
65
75
85
5
12
18
14
6
3
5
17
35
49
55
58
45
55
65
75
85
95
Σ
13/04/2015
11:10
58
Cálculo de P72
classe D4
1º Passo:
kn 72  58

 41,8 o
100
100
2º Passo:
l P72  65 ; N P72  1  35 ; n  58;
a P72  10 ; nP72  14
classe P72
3º Passo:
 72  58

 35 

100
  10  69 ,82
P72  65  
14
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.7) Exemplo (decil e percentil).
• Portanto, na distribuição analisada, tem-se que:
- O valor 55,34 indica que 40% dos elementos da
distribuição estão abaixo dele e os outros 60%
acima.
- O valor 69,82 indica que 72% dos elementos da
distribuição estão abaixo dele e os outros 28%
acima.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.8) Moda
• Moda (Mo) é a medida que indica o valor ou a gama
de valores nos quais a concentração dos dados
amostrais é máxima.
- Para variáveis discretas, a moda é o valor dos dados
que ocorre com maior freqüência;
- Para variáveis contínuas, a classe modal é o intervalo
de classe com maior freqüência.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.8) Moda
• Assim, da representação gráfica dos dados, obtém-se
imediatamente o valor que representa a moda ou a
classe modal.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.8) Moda
• Esta medida é especialmente útil para reduzir a
informação de um conjunto de dados qualitativos,
apresentados sob a forma de nomes ou categorias,
para os quais não se pode calcular a média e por
vezes a mediana (se não forem susceptíveis de
ordenação).
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.8) Moda (distribuições simples)
• Para distribuições simples (sem agrupamento em
classes), a identificação da moda é facilitada pela
simples observação do elemento que apresenta maior
freqüência.
- Exemplo: Para a distribuição abaixo Mo = 248.
13/04/2015
11:10
xi
243
245
248
251
307
ni
7
17
23
20
8
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.8) Moda (dados agrupados)
• Para dados agrupados em classe, existem diversas
fórmulas para o cálculo da moda:
- Fórmula de Czuber: Após a identificação da classe modal,
aplica-se a fórmula abaixo, onde
Mo  li 
13/04/2015
11:10
1
1  2
 ai
l = limite inferior da classe modal;
Δ1= diferença entre a freqüência absoluta da
classe modal e a imediatamente anterior;
Δ2 = diferença entre a freqüência absoluta da
classe modal e a imediatamente posterior;
ai = amplitude da classe modal.
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.8) Moda (dados agrupados)
- Exemplo: Determinar a moda para a distribuição:
13/04/2015
11:10
Classes
ni
35
45
55
65
75
85
5
12
18
14
6
3
45
55
65
75
85
95
- A classe com maior frequência absoluta é
[55, 65[; logo, ela é a classe modal.
- Aplicando a fórmula de Czuber, tem-se:
M o  li 
1
1   2
M o  55 
 ai
18  12
 10
( 18  12 )  ( 18  14 )
M o  61
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.8) Moda (dados agrupados)
- Densidades de classes: Quando as amplitudes das
classes são diferentes, deve-se calcular as densidades
de classes para identificar a classe modal, as quais são
obtidas por meio da relação ni/ai.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.8) Moda (dados agrupados)
- Exemplo: Determinar a moda para a distribuição:
Salários (US$)
80
180
250
300
Mo  li 
13/04/2015
11:10
180
250
300
500
1
1  2
ni
ai
ni/ai
70
140
140
60
100
70
50
200
0,7
2,0
2,8
0,3
 a i  250 
classe modal
2 ,8  2 ,0
 50  262,12
( 2 ,8  2 ,0 )  ( 2 ,8  0 ,3 )
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
a.8) Moda (dados agrupados)
- Fórmula de Pearson: Fornece uma boa aproximação
quando a distribuição apresenta razoável simetria em
relação à média. É dada pela relação:
Mo  3 ~
x  2x
ou seja, a moda é aproximadamente igual a diferença
entre o triplo da mediana e o dobro da média
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
 Observações:
1. Média versus Mediana:
 Diferença entre estas duas medidas fica mais clara quando se
considera o exemplo das notas obtidas por um aluno como
sendo: 10, 13, 11, 15, 18, 16, 14, 15, 14; nesse caso, como pode
ser comprovado, a média aritmética e a mediana são iguais a 14.
 Se esse aluno elevar a nota mais baixa, passando de 10 para 14,
a mediana ainda será o mesmo valor, mas o valor da média
sofrerá um aumento, passando para 14,4.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
 Observações:
1. Média versus Mediana:
 A média, ao contrário da mediana, é uma medida de posição
muito pouco resistente, isto é, ela é muito influenciada por
valores muito grandes ou muito pequenos, mesmo que estes
valores surjam em pequeno número na amostra.
 Estes valores são os responsáveis pela má utilização da média
em muitas situações em que teria mais significado utilizar a
mediana.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
 Observações:
1. Média versus Mediana:
 Entretanto, a preferência de uma ou de outra dependerá do
contexto em que forem utilizadas: se a distribuição é simétrica
essas medidas coincidem; caso contrário, observar que a mediana
não é tão sensível quanto a média, às observações que são muito
maiores ou muito menores do que as restantes; além disso, a
média reflete o valor de todas as observações.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
 Observações:
1. Média versus Mediana:
 Representação das distribuições dos dados na forma de uma
curva de freqüência:
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
a) Medidas de posição:
 Observações:
2. Relação entre as médias aritmética, geométrica e harmônica:
 A média geométrica de um conjunto de números positivos é
menor ou igual à sua média aritmética, mas é maior ou igual à
sua média harmônica:
H G x
 O sinal de igualdade somente é válido quanto todos os números
do conjunto de dados são idênticos.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
• São medidas estatísticas utilizadas para avaliar o grau de
variabilidade ou dispersão, dos valores em torno da
média.
• Servem para medir a representatividade da média
- Exemplo: Sejam as séries 20, 20, 20 e 15, 10, 20, 25, 30,
como pode ser calculado, ambas possuem média aritmética
igual a 20; entretanto, na primeira não existe dispersão,
enquanto a segunda apresenta dispersão em torno da média 20;
portanto, a média é muito mais representativa para a segunda
série.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.1) Amplitude total (ou amplitude amostral): É definida
como sendo a diferença entre o maior e o menor dos
valores da série, ou seja:
R  x máx  x min
- Exemplo: Para a série 10, 12, 15, 24, 25, 30, 36
R = 36 – 10 = 26
- Observação: É uma medida de dispersão muito limitada, pois
depende apenas dos valores externos, o que a torna instável, não
sendo afetada pela dispersão dos valores internos.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.2) Desvio médio: O desvio médio de um conjunto de n
números x1, x2 , ... , xn é definido por:
n
DM 
onde
13/04/2015
11:10
d
i 1
n
n
i

x
i 1
i
n
x

 x x
n
x  média aritmética dos números;
xi  x  valor absoluto do desvio de cada número
em relação à média aritmética.
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.2) Desvio médio (dados agrupados): Se x1, x2 , ... , xn
ocorrerem com as freqüências n1, n2, ... , nn,
respectivamente, o desvio médio poderá ser indicado
da seguinte forma:
n
DM 
13/04/2015
11:10
n
i 1
n
i
n
di

n
i 1
i
xi  x
n

n
i
x x
n
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.3) Variância: A variância de um conjunto de dados é
definida como o quadrado do desvio padrão, evitandose com isso que Σdi=0.
- Quando é necessário distinguir entre o desvio
padrão de uma população e o de uma amostra
dela extraída, adota-se frequentemente o símbolo
σ para o primeiro e s para o último.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.3) Variância:
- Para o caso da variância populacional são
adotadas as seguintes fórmulas:
n
2 
( x
i 1
i
 X )2
N
 
2
i 1
i
2
(dados não agrupados)
N
k
n ( x
( x  X )

i
N
 X )2
n (x X )


i
N
2
(dados agrupados)
X  média populacional; N  tamanho da população.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.3) Variância:
- Para o caso da variância amostral são adotadas
as seguintes fórmulas:
n
s 
2
( x
i 1
i
 x )2
n1
k
s 
2
n ( x
i 1
i
i
( x  x )

 x )2
n1
2
(dados não agrupados)
n1
n ( x  x )

i
n1
2
(dados agrupados)
x  média populacional; n  tamanho da população.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.3) Variância:
• Fórmulas práticas para os cálculos das variâncias:
13/04/2015
11:10
1 
2
   ni x i2 
N

 n x 
1 
2
 ni x i2 
s 
n1

 n x 
2
i
i
N
2
i
n
i






ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.4) Desvio padrão: Uma vez que a variância envolve a
soma de quadrados, a unidade em que se exprime não
é a mesma que a dos dados. Assim, para se conseguir
uma medida da variabilidade ou dispersão com as
mesmas unidades que os dados, toma-se a raiz
quadrada da variância e obtém-se o desvio padrão.
13/04/2015
11:10
  2
(desvio padrão populacional)
s  s2
(desvio padrão amostral)
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.4) Desvio padrão:
• O desvio padrão é uma medida que só pode assumir valores
não negativos e quanto maior for, maior será a dispersão
dos dados.
• Algumas propriedades do desvio padrão, que resultam
imediatamente da definição, são:
- o desvio padrão é sempre não negativo e será tanto maior,
quanta mais variabilidade houver entre os dados;
- se s= 0, então não existe variabilidade, isto é, os dados são
todos iguais.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.4) Desvio padrão:
• Exemplo: Calcular o desvio médio, a variância e o desvio
padrão da seguinte distribuição amostral:
xi
5
7
8
9
11
xi
ni
nixi
ni
2
3
5
4
2
5
7
8
9
11
2
3
5
4
2
10
21
40
36
22
Σ
16
129
- Média aritmética:
k
x
13/04/2015
11:10
n x
i 1
i
n
5
i

n x
i 1
i
16
i

129
 8 ,06
16
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.4) Desvio padrão:
• Exemplo: Calcular o desvio médio, a variância e o desvio
padrão da seguinte distribuição amostral:
- Desvio médio:
DM 
13/04/2015
11:10
n
i
x x
n

19,24
 1,2
16
xi
ni
ni x i
|xi-x| = |di|
ni|di|
5
7
8
9
11
2
3
5
4
2
10
21
40
36
22
|5 – 8,06| = 3,06
|7 – 8,06| = 1,06
|8 – 8,06| = 0,06
|9 – 8,06| = 0,94
|11 – 8,06| = 2,94
6,12
3,18
0,30
3,76
5,88
Σ
16
129
19,24
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.4) Desvio padrão:
• Exemplo: Calcular o desvio médio, a variância e o desvio
padrão da seguinte distribuição amostral:
- Variância:


2


n
x
1

i i
2
2
  ni x i 

s 
n1
n


1 
( 129 ) 2 
2
s 
1.083 
  2 ,86
16  1 
16 
- Desvio padrão:
s  s 2  2 ,86  1,69
13/04/2015
11:10
xi
ni
ni x i
ni 2 x i
5
7
8
9
11
2
3
5
4
2
10
21
40
36
22
50
147
320
324
242
Σ
16 129 1.083
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.5) Amplitude interquartílica:
• A medida anterior tem a grande desvantagem de
ser muito sensível à existência, na amostra, de
uma observação muito grande ou muito pequena.
• Por esse motivo, define-se uma outra medida, a
amplitude interquartílica.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.5) Amplitude interquartílica:
• Esta medida é, de certa forma, uma solução de
compromisso, pois não é afetada, de um modo
geral, pela existência de um pequeno número de
valores demasiadamente grandes ou pequenos. É
definida como sendo a diferença entre o 3º e 1º
quartis; assim:
DQ  Q3  Q1
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.5) Amplitude interquartílica:
• Da definição de amplitude interquartílica, pode-se concluir
que 50% dos elementos do meio da amostra estão contidos
num intervalo com aquela amplitude. Esta medida é não
negativa e será tanto maior quanto maior for a variabilidade
nos dados.
• Ao contrário do que acontece com o desvio padrão, uma
amplitude interquartílica nula não significa necessariamente,
que os dados não apresentem variabilidade.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.5) Amplitude interquartílica:
• Alguns autores preferem calcular uma medida
próxima da referida: a amplitude semiinterquartílica (ASI).
ASI 
13/04/2015
11:10
Q 3  Q1
2
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.6) Coeficiente de variação:
• A variação ou dispersão real, determinada a partir
do desvio padrão, ou qualquer outra medida de
dispersão, é denominada dispersão absoluta;
entretanto, uma variação ou dispersão, na medida
de uma determinada distância, é inteiramente
diferente quanto ao efeito, da mesma variação em
uma distância menor.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.6) Coeficiente de variação:
• A medida desse efeito é proporcionada pela
dispersão relativa, definida por:
Dispersão relativa 
13/04/2015
11:10
Dispersão absoluta
Média
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.6) Coeficiente de variação:
• Se a dispersão absoluta é o desvio padrão e a
média é a aritmética, a dispersão relativa é
denominada coeficiente de variação ou de
dispersão, dado por:
CV 

X
 100
ou
CV 
s
 100
x
• coeficiente de variação é uma medida relativa de dispersão,
útil para a comparação em termos relativos do grau de
concentração em torno da média de séries distintas.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.6) Coeficiente de variação:
• Exemplo: Em uma empresa, o salário médio dos homens é
de $4.000,00, com desvio padrão de $1.500,00, e o das
mulheres é em média de $3.000,00, com desvio padrão de
$1.200,00. Então:
Para os homens:
Para as mulheres:

1500
 100  37 ,5%
X
4000

1200
CV   100 
 100  40 ,0%
X
3000
CV 
 100 
• Desses valores conclui-se, portanto, que o salário das
mulheres apresentam maior dispersão que os dos homens
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
b) Medidas de dispersão
b.6) Coeficiente de variação:
• Diz-se que a distribuição possui baixa, média ou alta
variabilidade (dispersão) conforme os seguintes valores:
Baixa dispersão: CV ≤ 10%
Média dispersão: 10% < CV < 20%
Alta dispersão: CV ≥ 20%
• Alguns analistas consideram valores diferentes:
Baixa dispersão: CV ≤ 15%
Média dispersão: 15% < CV < 30%
Alta dispersão: CV ≥ 30%
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
c) Medidas de forma
c.1) Medidas de assimetria:
• Denomina-se assimetria o grau de desvio ou
afastamento da simetria de uma distribuição.
• Uma distribuição de freqüência pode simétrica,
assimétrica positiva ou assimétrica negativa.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
c) Medidas de forma
c.1) Medidas de assimetria:
• Uma distribuição simétrica apresenta a igualdade entre as três
medidas de posição, média aritmética, mediana e modo, ou:
Mo  ~
xx
• Em uma distribuição assimétrica positiva, ou assimétrica à
direita, tem-se que:
Mo  ~
xx
• Em uma distribuição assimétrica negativa, ou assimétrica à
esquerda, tem-se que:
x~
x  Mo
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
c) Medidas de forma
c.1) Medidas de assimetria:
• Existem várias fórmulas para o cálculo do coeficiente de
assimetria, dentre elas duas são bastante utilizadas:
x  Mo
- 1º Coeficiente de Pearson:
AS 
- 2º Coeficiente de Pearson:
Q1  Q 3  2 ~
x
AS 
Q 3  Q1

ou
AS 
x  Mo
s
• Se AS = 0, a distribuição é simétrica
AS > 0, a distribuição é assimétrica positiva
AS < 0. a distribuição é assimétrica negativa.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
c) Medidas de forma
c.1) Medidas de assimetria:
• Exemplo: Identificar o grau de assimetria da
distribuição:
13/04/2015
11:10
Salários ($1.000,00)
30 50
50 100
100 150
Empregados
80
50
30
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
c) Medidas de forma
c.1) Medidas de assimetria:
• Exemplo:
Classes
xi
30 50 40
50 100 75
100 150 125
Σ
13/04/2015
11:10
ni
nix i
80
50
30
3200
3750
3750
160 10.700
nix i2
ni/ai
128.000 80/20 = 4
281.250 50/50 = 1
468.750 30/50 = 0,6
Ni
80
130
160
878.000
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
c) Medidas de forma
c.1) Medidas de assimetria:
• Exemplo:
10.700
 66 ,875
160
1 
( 10.700 ) 2 
s2 
878
.
000


  1021,62
159 
160 
x
M o  30 
s2 
4
 20  41,429
43
1 
( 10.700 ) 2 
878
.
000


  1021,62
159 
160 
s  31,96
Q1  30 
Q 3  50 
( 40  0 )
 20  40
80
( 120  80 )
 50  90
50
( 80  0 )
~
x  30 
 20  50
80
x  M o 66 ,85  41,429
AS 

 0 ,796
s
31,96
Q1  Q 3  2 ~
x 40  90  2
AS 

 0 ,6
Q 3  Q1
90  40
- Como AS > 0, então a distribuição é assimétrica positiva.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
c) Medidas de forma
c.2) Medidas de curtose:
• Denomina-se curtose o grau de achatamento de
uma distribuição.
• Uma distribuição de freqüência pode ser:
- Mesocúrtica: quando sua forma nem é achatada e
nem delgada;
- Leptocúrtica: quando apresenta a forma delgada;
- Platicúrdica: quando apresenta a forma achatada.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
c) Medidas de forma
c.2) Medidas de curtose:
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
c) Medidas de forma
c.2) Medidas de curtose:
• Para medir o o grau de curtose utiliza-se o coeficiente:
K
Q 3  Q1
2( P90  P10 )
onde Q3 = 3º quartil; P90 = 90º percentil;
Q1 = 1º quartil; P10 = 10º percentil.
• Se K = 0,263 – a curva correspondente à distribuição é
mesocúrtica;
K > 0,263 – a curva é platicúrdica;
K < 0,263 – a curva é leptocúrdica.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.5 Estatísticas Amostrais
c) Medidas de forma
c.2) Medidas de curtose:
• Exemplo: Para a mesma distribuição do exemplo da assimetria,
calcula-se ainda P10 e P90; logo:
( 16  0 )
 20  34
80
( 144  130 )
P90  100 
 50  104,375
160
Q 3  Q1
90  40
K

 0 ,355
2( P90  P10 ) 2( 104,375  34 )
P10  30 
- Como K > 0,273, então a distribuição é do tipo platicúrtica.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
I - Estatística Descritiva

Introdução

Conceitos e definições

Classificação dos dados

Caracterização e apresentação dos dados

Estatísticas amostrais

Outras apresentações gráficas de dados

Regressão linear
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.6 Outras Apresentações Gráficas de Dados
•
•
•
Além dos diagramas já estudados, existem outras formas bastante
utilizadas internacionalmente para apresentar os dados amostrais. Um
bom modo de obter uma apresentação visual eficiente de um conjunto de
dados pode ser conseguido por meio de três tipos de gráficos: diagramas
de pontos, diagramas de ramo e folhas e diagramas de caixa.
O diagrama de pontos é uma apresentação útil de dados, no caso de
amostras pequenas (até cerca de 20 observações). Entretanto, quando o
número de observações for moderadamente alto, o diagrama de ramo e
folhas e o diagrama de caixa podem ser mais úteis.
Questões como quantidades de dados abaixo de certo valor, tendência
central (média ou mediana), dispersão (desvio-padrão), possibilidade de
detectar outliers (pontos bastante diferentes do conjunto de dados) e o
desvio da simetria, não são fáceis de responder, pois existem muitas
observações, e a construção de um diagrama de pontos, usando esses
dados, seria relativamente ineficiente .
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.6 Outras Apresentações Gráficas de Dados
 Diagrama de pontos
• Um diagrama de pontos é um gráfico estatístico que consiste em
grupos de pontos de dados traçados em uma escala simples.
• São utilizados para dados contínuos, quantitativos e univariados, e
são muito úteis para exibir um pequeno conjunto de dados.
• Esse tipo de gráfico permite uma fácil visualização de duas
características dos dados: a posição (meio) e a dispersão
(espalhamento ou variabilidade)
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.6 Outras Apresentações Gráficas de Dados
 Diagrama de pontos
• Exemplo 01 (Montgomery, 2004, p.2-3): Um engenheiro está
projetando um conector de náilon para ser usado em aplicação
automotiva. Ele considera estabelecer como especificação do projeto
uma espessura de 3/32 pol., mas está inseguro. Oito unidades do
protótipo são produzidas e suas forças de remoção são medidas,
resultando nos seguintes dados (em libras): 12,6; 12,9; 13,4; 12,3;
13,6; 13,5; 12,6 e 13,1. Construa um diagrama de pontos para esses
dados.
12
13/04/2015
11:10
13
14
Força de remoção
15
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.6 Outras Apresentações Gráficas de Dados
 Diagrama de pontos
• Exemplo 02: O engenheiro do exemplo anterior decide considerar
um projeto alternativo com uma espessura maior da parede do
conector, 1/8 pol. Oito protótipos desse projeto são construídos,
sendo as medidas observadas da força de remoção, resultando nos
seguintes dados (em libras): 12,9; 13,7; 12,8; 13,9; 14,2; 13,2; 13,5 e
13,1. Construa um diagrama de pontos para esses dados,
sobrepondo-o ao anterior para uma melhor análise da influência da
espessura da parede na força de remoção.
12
3/32 pol.
1/8 pol.
13/04/2015
11:10
14
15
13,0 13,4
Força de remoção
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.6 Outras Apresentações Gráficas de Dados
 Diagrama de ramo e folhas
• Esta forma de apresentação de dados tem sido freqüentemente
utilizada em trabalhos técnicos do mundo inteiro.
• Para construir o diagrama de ramo e folhas, dividimos o elemento
amostral em duas partes: um ramo (stem), consistindo em um ou
mais dígitos iniciais, e uma folha (leaf), consistindo nos dígitos
restantes.
Exemplo: O dado 458 é dividido em duas partes, a primeira parte 45,
e a segunda parte 8.
• Geralmente, escolhe-se relativamente poucos ramos em comparação
ao número de observações (5 a 20 itens).
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.6 Outras Apresentações Gráficas de Dados
 Diagrama de ramo e folhas
• Exemplo (Montgomery, 2004, p.16): Considere o
conjunto de dados abaixo, relativos à resistência a
compressão de uma liga de alumínio.
105
245
207
218
160
221
228
180
157
175
183
174
190
101
149
186
199
193
171
87
121
181
194
165
160
181 180
158 176
133 156
172 158
237 150
143
110
123
169
135
97
163
134
199
196
154
131
178
151
201
153 174
154 115
76 167
142 163
200 176
120
160
184
145
150
168
208
135
171
170
167
158
229
148
118
141
133
146
158
149
O diagrama de ramo e folhas resultante é apresentado a
seguir:
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.6 Outras Apresentações Gráficas de Dados
 Diagrama de ramo e folhas (dados brutos)
Ramo
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
13/04/2015
11:10
Folha
6
7
7
5
5
1
4
2
4
3
8
0
9
7
8
1
7
5
1
8
0
1
9
7
0
5
3
6
1
0
3
3
5
1
7
4
6
0
0
8 9
5
8
3
3
4
1
9
8
3
3
4
0
1
4
3
5
1
0
5
6
1
4
6
8
0
2
0
9
8 6 8 0 8
8 7 9
1 0 6
Frequência
1
1
1
2
3
3
6
8
12
10
10
7
6
4
1
3
1
1
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.6 Outras Apresentações Gráficas de Dados
 Diagrama de ramo e folhas (dados ordenados)
Ramo
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
13/04/2015
11:10
Folha
6
7
7
1
0
0
1
1
0
0
0
0
0
0
8
1
7
5
5
5
1
3
2
0
0
1
0
3
1
8
3
3
3
1
0
1
1
4
7
8 9
4
5
3
3
2
1
6
8
5
6
4
3
4
3
9
5
8
4
5
4
4
9
9
6
7
5
6
9
7 8 8 8 8
7 8 9
6 6 8
Frequência
1
1
1
2
3
3
6
8
12
10
10
7
6
4
1
3
1
1
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.6 Outras Apresentações Gráficas de Dados
 Diagrama de ramo e folhas
• Em alguns casos pode ser desejável construir mais intervalos ou
ramos. Uma maneira de fazer isto seria dividir o ramo escolhido em
dois ou mais novos ramos, conforme mostrado abaixo:
Ramo
14L
14U
15L
15U
13/04/2015
11:10
Folha
1
6
0
6
2
8
0
7
3
9
1
8
5
9
3 4 4
8 8 8
Ramo
14z
14t
14f
14s
14e
15z
15t
15f
15s
15e
Folha
1
2
3
5
0
1
4
6
8
0
3
4
7 8
8 8
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.6 Outras Apresentações Gráficas de Dados
 Diagrama de ramo e folhas
Freqüência acumulada
Ramo
1
2
3
5
8
11
17
25
37
(10)
33
23
16
10
6
5
2
1
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
N = 80
Min = 76
Max = 245
Média = 162,7
Mediana = 161,5
Q1 = 143,50
Q3 = 181,00
S2 = 33,77
13/04/2015
11:10
Folha
6
7
7
1
0
0
1
1
0
0
0
0
0
0
8
1
7
5
5
5
1
3
2
0
0
1
0
3
1
8
3
3
3
1
0
1
1
4
7
4
5
3
3
2
1
6
8
5
6
4
3
4
3
9
5
8
4
5
4
4
9
9
6
7
5
6
9
7 8 8 8 8
7 8 9
6 6 8
8 9
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.6 Outras Apresentações Gráficas de Dados
 Diagrama de ramo e folhas
• Exercício (Montgomery, 2004, p.17): Os seguintes dados são os
números de ciclos até a falha, de corpos de prova de alumínio,
sujeitos a uma tensão alternada repetida, de 21.000 psi e 18 ciclos
por segundo:
1115
1310
1540
1502
1258
1315
1085
798
1020
865
2130
1421
1109
1481
13/04/2015
11:10
1567
1883
1203
1270
1015
845
1674
1016
1102
1605
706
2215
785
885
1223
375
2265
1910
1018
1452
1890
2100
1594
2023
1315
1269
1260
1888
1782
1522
1792
1000
1820
1940
1120
910
1730
1102
1578
758
1416
1560
1055
1764
1330
1608
1535
1781
1750
1501
1238
990
1468
1512
1750
1642
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.6 Outras Apresentações Gráficas de Dados
 Diagrama de ramo e folhas
• (a) Construa um diagrama de ramo e folhas para esses dados. (b)
Você acha que o corpo de prova “sobreviverá” além de 2.000
ciclos? Justifique a sua resposta. (c) Encontre a mediana e os quartis.
a)
13/04/2015
11:10
Profundidade
Ramo
1
5
8
10
17
22
29
33
(5)
32
22
18
11
7
5
4
2
3
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
Folha
75
06
45
10
00
02
03
10
16
01
05
30
20
10
23
00
15
58
65
90
15
02
23
15
21
02
08
50
83
40
85 98
85
16
09
38
15
52
12
42
50
88
18
15
58
30
68
22
74
64
90
20 55 85
20
60 69 70
81
35 40 60 67 78 94
81 82 92
b) Não. A probabilidade
é muito pequena.
c) M = 1436,5
Q1 = 1097,8
Q3 = 1735
30
65
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.6 Outras Apresentações Gráficas de Dados
 Diagrama de caixa (box plot)
• Uma outra forma gráfica de apresentar os dados é o chamado
diagrama de caixa (box plot) ou diagrama de caixa e linhas (box and
whiskers), que permite descrever simultaneamente vários fatores
importantes de uma série de dados, tais como a tendência central
(média ou mediana), a dispersão (desvio-padrão), a possibilidade de
detectar outliers (pontos bastante diferentes do conjunto de dados) e
o desvio da simetria.
• Um diagrama de caixa apresenta três quartis, em uma caixa
retangular, alinhados tanto horizontal como verticalmente;
opcionalmente, pode apresentar a média.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.6 Outras Apresentações Gráficas de Dados
 Diagrama de caixa (box plot)
• A caixa inclui a amplitude interquartil, com o canto esquerdo (ou
inferior) no primeiro quartil, Q1, e o canto direito (ou superior) no
terceiro quartil, Q3. Portanto, o comprimento da caixa é igual a
amplitude interquartil , DQ = Q3 - Q1.
• Uma linha é desenhada através da caixa, no segundo quartil (que é o
percentil 50 ou a mediana), Q2. A média, como já dito, é opcional.
• Uma linha (whisker) estende-se de cada extremidade da caixa.
• A linha inferior (ou esquerda) começa no primeiro quartil indo até o
menor valor do conjunto de pontos dentro das amplitudes
interquartis de 1,5, a partir do primeiro quartil.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.6 Outras Apresentações Gráficas de Dados
 Diagrama de caixa (box plot)
• A linha superior (ou direita) começa no terceiro quartil indo até o
maior do conjunto de pontos dentro das amplitudes interquartis de
1,5, a partir do terceiro quartil.
• Dados mais afastados dos que as linhas são plotados como pontos
individuais. Um ponto além da linha, porém a menos de 3
amplitudes interquartis a partir da extremidade da caixa, é chamado
de dispersos (outliers).
• Um ponto a mais de 3 amplitudes interquartis a partir da
extremidade da caixa é chamado de um outlier extremo.
Ocasionalmente, símbolos diferentes (círculos abertos e fechados,
por exemplo) são usados para identificar os dois tipos de outlier.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.6 Outras Apresentações Gráficas de Dados
 Diagrama de caixa (box plot)
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.6 Outras Apresentações Gráficas de Dados
 Diagrama de caixa (box plot)
• Exercício: Represente o diagrama de caixa para os dados da
resistência à compressão do alumínio mostrados no exercício
anterior.
N = 80
Min = 76
Max = 245
Média = 162,7
Mediana = 161,5
Q1 = 143,50
Q3 = 181,00
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
I - Estatística Descritiva

Introdução

Conceitos e definições

Classificação dos dados

Caracterização e apresentação dos dados

Estatísticas amostrais

Outras apresentações gráficas de dados

Regressão linear
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Relação entre duas variáveis
• Em inúmeras ocasiões o estudo descritivo não se resume
ao estudo de apenas uma variável; para se ter uma visão
global do problema em estudo, muitas vezes é necessário
a observação de duas ou mais variáveis.
• Nesse caso, em vez de uma amostra (x1, x2, ..., xn), passase a ter dados bivariados (xi, yi), i = 1, 2, ..., n.
• Um dos objetivos desse estudo é a relação existente entre
as variáveis do par.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Correlação linear
• Para se ter uma idéia de como as duas variáveis se
relacionam é comum representar graficamente esta
relação por meio de um diagrama de dispersão. Esta
representação consiste na marcação das observações em
um sistema de eixos cartesianos.
• Se as variáveis fornecem um diagrama de dispersão em
que os pontos se colocam ao redor de uma reta crescente
ou decrescente, diz-se que essas variáveis estão
linearmente correlacionadas.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Correlação linear
• Quanto menor a dispersão dos pontos em torno da reta,
mais forte será a correlação.
• A correlação linear será positiva ou negativa caso a
tendência da reta seja crescente ou decrescente.
• Se nenhuma tendência positiva ou negativa pode ser
detectada, a explicação possível para os valores da
segunda variável é sua média. Nesse caso, o eixo da
dispersão será horizontal, contendo a média da segunda
variável, e diz-se que as variáveis não são linearmente
correlacionadas.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Correlação linear
y
y
y
x
13/04/2015
x
x
Correlação linear forte
Correlação linear forte
Correlação linear fraca
(positiva)
(negativa)
(positiva)
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Correlação linear
y
y
y
y
x
Variáveis não
correlacionadas
13/04/2015
11:10
x
Variáveis não
correlacionadas
linearmente
x
Variáveis não
correlacionadas
linearmente
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Correlação linear
• Exemplo: A tabela abaixo mostra os dados da temperatura do gás
combustível (ºF) e da respectiva taxa de calor (Btu/kwh) para uma
turbina de combustão, para ser usada em refrigeração, construa o
diagrama de dispersão para esses dados.
x
100
125
150
175
200
225
250
275
y
99,1
98,8
98,5
98,5
98,5
98,2
98,0
97,8
x
300
325
350
375
400
425
450
500
y
97,8
97,8
97,6
97,5
97,3
97,0
96,8
96,7
• Desse diagrama pode-se extrair que talvez exista uma correlação
linear entre as variáveis; esta relação pode ser traduzida por meio
de uma reta.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Coeficiente de correlação linear
• A determinação da correlação entre duas variáveis por
meio de uma inspeção nos pares anotados ou no
diagrama de dispersão correspondente é pouco precisa e
subjetiva.
• Essa dificuldade pode ser contornada pelo uso de uma
medida que caracterize a correlação linear e seja
independente do observador que esteja examinando os
dados.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Coeficiente de correlação linear
• Karl Pearson propôs o chamado coeficiente de
correlação linear, o qual é dado pela relação:
r
Cov ( x , y )
s x2  s 2y
onde: Cov (x,y) é a covariância das variáveis x e y, e seu
cálculo é dado por
( x  x ) ( y  y )

Cov ( x , y ) 
n1
e sx2 e sy2 são as variâncias da variáveis x e y.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Coeficiente de correlação linear
• Fazendo-se as devidas substituições e simplificações,
obtém-se o coeficiente de correlação de forma mais
simples:
s
r
xy
s xx  s yy
onde:
s yy   y
1 r  1
s xx   x
13/04/2015
11:10

x


2
2
n
s xy  

y


2
2
n
x y

xy 
n
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Coeficiente de correlação linear
• r = -1, indica correlação linear negativa perfeita; os
pontos (x,y) estão sobre uma reta com coeficiente angular
negativo.
• r = 0, indica que os pontos não estão correlacionados,
nem apresentam tendência crescente ou decrescente.
• r = 1, indica correlação linear positiva perfeita; os pontos
(x,y) estão sobre uma reta com coeficiente angular
positivo.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Coeficiente de correlação linear
• Nos casos em que os pontos do diagrama de dispersão estão em uma
reta vertical ou horizontal, o quociente que calcula o coeficiente de
correlação não está definido, pois apresenta numerador e
denominador nulos. Nesse caso, o coeficiente de correlação será
considerado nulo.
y
y
x
r = 0, Cov (x,y) = 0, sy2 = 0
13/04/2015
11:10
x
r = 0, pois Cov (x,y) = 0, sx2 = 0
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Coeficiente de correlação linear
• A correlação entre duas variáveis pretende captar o fato
dessas variáveis apresentarem a mesma tendência ao
crescimento, ou tendências contrárias.
• O fato de duas variáveis evoluírem no mesmo sentido ou
em sentidos opostos fornece uma idéia do que se pode
esperar sobre um valor desconhecido da variável y para
um particular valor de x.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Coeficiente de correlação linear
• Se as variáveis x e y são positivamente correlacionadas, e se procura
estimar o valor de y1 para certo valor x1 menor que a média x, devese esperar o valor correspondente y1 menor que a média y ; para um
valor x2 maior que a média x , deve-se esperar um valor y2 maior que
a média y, acompanhando a tendência do eixo crescente dos pontos.
y
y2
y
y1
x1
13/04/2015
11:10
x x2
x
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Coeficiente de correlação linear
• Os problemas que envolvem estimativas de valores desconhecidos a
partir de valores históricos são chamados problemas de previsão ou
predição.
• O conhecimento da correlação entre duas variáveis, embora possa
fornecer uma pista para a previsão de um valor desconhecido de uma
delas, nada informa a respeito da qualidade dessa previsão, ou seja,
não se pode, em geral, com base apenas no conhecimento da
correlação, transformar a incerteza da previsão em risco (isto só pe
possível quando a correlação é perfeita).
• Entretanto, o fato de duas variáveis serem correlacionadas levanta a
possibilidade de uma relação causal entre elas, o que é importante
em problemas de previsão.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Regressão linear simples
• Como visto anteriormente, uma previsão construída
baseada nas informações obtidas da correlação nada diz a
respeito da confiabilidade do valor previsto.
• Um método de previsão que permite a avaliação em
termos de confiabilidade é a regressão linear, pois,
satisfeitas determinadas condições, ela proporciona a
transformação da incerteza em risco
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Regressão linear simples – Modelo teórico
• Quando se verifica, quer por meio do gráfico de
dispersão, quer pelo coeficiente de correlação linear, uma
correlação forte entre duas variáveis, a relação entre
essas variáveis pode ser descrita por meio de uma reta de
regressão (a reta que melhor se ajusta aos dados).
• Essa reta serve de modelo matemático para expressar a
relação linear entre duas variáveis.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Regressão linear simples – Modelo teórico
• Considere o relacionamento de duas variáveis x e y com
as seguintes características:
x: é a variável cujos valores são controlados e, portanto,
determinados; ela é conhecida por variável independente ou
variável de decisão;
y: variável aleatória; é a variável que se quer prever; seu valor
depende do valor atribuído a x, embora para cada valor de x se
possa ter vários valores de y, devido a sua característica aleatória
(variável dependente de x).
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Regressão linear simples – Modelo teórico
• O modelo teórico define a verdadeira reta de regressão, cuja
equação pode ser escrita como:
y   x
O valor de y é dado por:
y  yU
ou
y    x U
onde:
y é a parte funcional de y (a parte do valor de y explicada pelo
valor de x);
U é a parte aleatória de y, a qual é introduzida no valor de y por
fatores imponderáveis.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Regressão linear simples – Modelo teórico
• Nessas condições, dado um valor para x, a previsão ou expectativa
para o correspondente valor de y é:
y   x
• Entretanto, dificilmente se conhece a população dos valores de y
para cada valor da variável controlada x. O que se conhece,
geralmente, são alguns valores dos pares (x,y), ou seja, apenas uma
amostra dessas variáveis.
• Portanto, com base nos dados amostrais, deve-se pensar como
estimar os valores de α e β, o que pode ser ser feito de forma
eficiente por meio do método dos mínimos quadrados.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Método dos mínimos quadrados
• Um dos métodos mais utilizados para ajustar uma reta a um conjunto
de dados é o Método dos Mínimos Quadrados (MMQ), o qual
consiste em determinar a reta que minimiza a soma dos quadrados
dos desvios (os chamados erros ou resíduos) entre os verdadeiros
valores de y e os valores estimados a partir da reta de regressão que
se pretende ajustar, ŷ.
ŷ^ = a + bx
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Método dos mínimos quadrados
• Adota-se o quadrado das diferenças, pois como os pontos
se situam acima e abaixo da reta estimada, as diferenças
podem ser positivas ou negativas, e na soma podem
anular-se, não refletindo o ajustamento.
• Sendo números positivos, esses quadrados refletem a
qualidade do ajuste através de sua soma.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Método dos mínimos quadrados
• O modelo de regressão linear é a reta de regressão
ŷi = a + bxi + εi
onde
ŷ é o estimador de y;
a e b os estimadores de α e β.
• A reta estimada é obtida de tal modo que a soma dos quadrados dos
desvios ou resíduos (εi = yi – ŷ) seja mínima, ou seja,
min  i2  min ( yi  ˆyi )2  min  [ yi  ( a  bxi )] 2
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Método dos mínimos quadrados
• Como tal, para estimar os parâmetros do modelo, é necessário que as
primeiras derivadas em relação a a e a b sejam nulas, e as segundas
sejam maiores ou iguais a zero, assim:
 
2
  a  ( y i  a  bxi )  0


 
( y i  a  bxi ) 2  0

  b
As estimativas dos mínimos quadrados para os parâmetros α e β são:
a
13/04/2015
11:10
 y bx  ybx
n
n
,
b

x y

xy 
n
 x 

2
x
2

s xy
s xx
n
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Coeficiente de explicação
• Calculada a estimativa de mínimos quadrados para uma
amostra dada, deve-se verificar a qualidade do ajuste
dessa reta aos dados históricos.
• Uma forma de medir a qualidade do ajuste é verificar
qual a porcentagem da variação dos valores de y em
relação à sua média pode ser explicada pela regressão de
y sobre x, o que dará origem ao coeficiente de explicação
R2.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Coeficiente de explicação
• Do gráfico abaixo, onde ŷ = a + bx é a regressão de y sobre x,
observa-se que o valor de yi correspondente a um valor xi pode ser
composto de duas partes: a parte explicada pela média e a parte não
explicada pela média.
y
yi
ŷ
y
ŷ = a + bx


xi
13/04/2015
11:10
yi  ˆy  parte do valor de y não explicada pela média

ˆy  y  parte do valor de y explicada pela regressão
y  parte do valor de y explicada pela média
x
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Coeficiente de explicação
• Interessa avaliar que porcentagem da parte não explicada pela
média, y i  y , pode ser explicada pela regressão de y sobre x, isto é,
por ˆy  y .
• No método dos mínimos quadrados, ao invés de somar essas
diferenças, soma-se o quadrado delas para evitar que valores
positivos e negativos se anulem.
• Designando:
VT = variação total, soma dos quadrados das variações de y em
relação à sua média.
2
VT   y  y 

i
VE = variação explicada, a soma dos quadrados das variações em
2
relação à média.
VE    ˆy  y 
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Coeficiente de explicação
• O coeficiente de explicação R2 pode ser definido agora como sendo
a porcentagem da variação total representada pela variação
explicada.
VE
R2 

VT
R  b
2

x y

xy 
y
13/04/2015
11:10
2
ˆ


y

y

2
  yi  y
2

n
y


2
ou
R  b
2
s xy
s yy
R2  r 2
n
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Método dos mínimos quadrados
• Exemplo: No exemplo anterior, observou-se no diagrama
de dispersão uma possível relação linear entre as
variáveis.
a) Confirme essa relação por meio do coeficiente de
correlação;
b) Encontre a reta de regressão pelo método dos
mínimos quadrados.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Método dos mínimos quadrados
i
x
y
x2
y2
xy
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
100
125
150
175
200
225
250
275
300
325
350
375
400
425
450
500
99,1
98,8
98,5
98,5
98,5
98,2
98,0
97,8
97,8
97,8
97,6
97,5
97,3
97,0
96,8
96,7
10000
15625
22500
30625
40000
50625
62500
75625
90000
105625
122500
140625
160000
180625
202500
250000
9820,8
9761,4
9702,2
9702,2
9702,2
9643,2
9604,0
9564,8
9564,8
9564,8
9525,8
9506,2
9467,3
9409,0
9370,2
9350,9
9910,0
12350,0
14775,0
17237,5
19700,0
22095,0
24500,0
26895,0
29340,0
31785,0
34160,0
36562,5
38920,0
41225,0
43560,0
48350,0
Σ
4625
1565,9
1559375
153259,8
451365,0
13/04/2015
11:10
• Cálculos:
r
s xy
s xx  s yy

x y
 xy   n
r
x
 x 

2
2
n

y
 y 

2
2
n
4625 1565,9
451365
16
r
( 4625)2
( 1565,9 )2
1559375
 153259,8 
16
16
r   0 ,99
R 2  (  0 ,99 )2  0 ,977
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Método dos mínimos quadrados
• Cálculos:
- O valor da correlação e do coeficiente de explicação indicam uma
forte correlação linear entre a temperatura do gás combustível e a
taxa de calor. Pode-se, portanto, estimar, através do MMQ os
parâmetros a e b e traçar a reta de regressão:
b
 xy 
 x y
n
x


2

4625 1565,9
16
 0 ,0057
2

4625
1559375
16
451365
x  n
 y  b   x  1565,9  ( 0 ,0057 )  4625  99,516
a
2
n
n
16
16
- Sendo assim a reta de regressão é: ˆy  a  bx  99,516  0 ,0057x
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Funções linearizáveis
• Para que se evite erros de previsão, a condição inicial para
um estudo de regressão linear entre duas variáveis é que
essas variáveis apresentem uma razoável correlação
linear.
• Caso os valores de y para crescentes valores de x variem
de modo aleatório, sem apresentar qualquer tendência, o
valor que melhor explica y é, geralmente, a sua média;
entretanto, em alguns casos, o diagrama de dispersão
apresenta uma tendência não linear, isto é, uma curva bem
definida, em torno da qual os pontos parecem agrupar-se.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Funções linearizáveis
• Existe um grupo de funções que apresentam diagramas
ajustáveis a muitas dessas tendências, e que possuem a
qualidade de poder transformar-se em funções lineares
com a aplicação de logaritmos ou por mudança de
variável.
• A forma linear dessas funções transformadas pode então
ser usada para estimar os parâmetros da curva ajustada
àquela tendência, conforme será estudado a seguir.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Funções linearizáveis
1. Função potência:
y = a.xb, com x ≥ 0 e b ≥ 0
• Para este caso, a primeira e a segunda derivadas da função
fornecem a forma da curva.
y
y
b>1
x
Crescente
Concavidade para cima
Contém a origem
13/04/2015
11:10
0<b<1
x
Crescente
Concavidade para baixo
Contém a origem
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Funções linearizáveis
1. Função potência:
y = a.xb, com x ≥ 0 e b ≥ 0
• Se x = 0, então y = 0.
• Para x > 0, aplicando o logaritmo, tem-se: ln y = ln a + b.ln x
• Fazendo Y = ln y, A = ln a e X = ln x, tem-se a forma linear:
Y = A + b.X
O diagrama de dispersão de (X = ln x, Y = ln y) e o coeficiente de
correlação correspondente podem indicar a oportunidade e
qualidade do ajuste.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Funções linearizáveis
2. Função exponencial:
y = abx, a > 0, b > 0, x ≥ 0
• Como no caso anterior, as derivadas fornecem a forma das curvas.
y
y
a
0<b<1
a
b>1
x
Crescente
Concavidade para cima
x=0→y=a
13/04/2015
11:10
x
Decrescente
Concavidade para cima
x=0→y=a
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Funções linearizáveis
2. Função exponencial:
y = abx, a > 0, b > 0, x ≥ 0
• Aplicando o logaritmo, tem-se: ln y = ln a + x.ln b
• Fazendo Y = ln y, A = ln a e B = ln b, tem-se a forma linear:
Y = A + B.x
O diagrama de dispersão de (x, Y=lny) e o coeficiente de
correlação correspondente podem indicar a oportunidade e
qualidade do ajuste.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Funções linearizáveis
2. Função hiperbólica, tipo I:
ya
b
, x  0, a  0, y  0
x
• A primeira e a segunda derivadas fornecem a forma das curvas.
y
y
a
b<0
b>0
a
x
Decrescente
Concavidade para cima
Assíntota em x = 0 e y = a
13/04/2015
11:10
- b/a
x
Crescente
Concavidade para baixo
Assíntota em y = a
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Funções linearizáveis
3. Função hiperbólica, tipo I:
ya
b
, x  0, a  0, y  0
x
• Fazendo X = 1/x, obtém-se a forma linear:
y = a + b.X
O diagrama de dispersão de (X=1/x, y) e o coeficiente de
correlação correspondente podem indicar a oportunidade e
qualidade do ajuste.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Funções linearizáveis
4. Função hiperbólica, tipo II:
y
1
, a  0, b  0, x  0
a  bx
• As derivadas da função indicam que a curva é decrescente e tem
concavidade voltada para cima, com assíntotas em y = 0. Para x
=0, y = 1/a.
y
1/a
x
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Funções linearizáveis
4. Função hiperbólica, tipo II:
y
1
, a  0, b  0, x  0
a  bx
• Fazendo Y = 1/y, obtém-se:
1
1

Y a  bx
ou
Y  a  bx
O diagrama de dispersão de (x, Y=1/y) e o coeficiente de
correlação correspondente podem indicar a oportunidade e
qualidade do ajuste.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Funções linearizáveis
5. Função logaritmo:
y = a + b.ln x, x > 0
• As derivadas indicam a forma da curva:
y
y
b<0
b>0
e- a/b
x
Crescente
Concavidade para baixo
13/04/2015
11:10
x
e-a/b
Decrescente
Concavidade para cima
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Funções linearizáveis
5. Função logaritmo:
y = a + b.ln x, x > 0
• Fazendo X = ln x, obtém-se a forma linear:
y  a  bX
O diagrama de dispersão de (X=ln x, y) e o coeficiente de
correlação correspondente podem indicar a oportunidade e
qualidade do ajuste.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Funções linearizáveis
• Exemplo: Um estudo sobre a oferta de mercado de um
produto revelou as quantidades que os produtores
estariam dispostos a oferecer a vários níveis de preços
13/04/2015
x = preço
10,00
10,50
11,00
11,50
12,00
12,50
13,00
13,50
y = oferta
(em 1000 un.)
427
440
447
453
460
465
470
472
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Funções linearizáveis
• Exemplo:
a. Construa um diagrama de dispersão para os dados da tabela;
b. Calcule o coeficiente de correlação linear das variáveis;
c. O diagrama de dispersão sugere o uso de alguma forma linearizável
para ajustar os pontos?
d. Construa o gráfico de dispersão da forma linear correspondente à
função escolhida em (c);
e. Calcule o coeficiente de correlação dos pares em (d);
f. Comente os resultados obtidos;
g. Calcule a regressão de y sobre x para a função de maior correlação;
h. Calcule o coeficiente de explicação para a função escolhida em (g);
i. Calcule a oferta para um preço de 15,00.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Funções linearizáveis
• Solução:
a. Diagrama de dispersão
y
475
470
465
460
455
450
445
440
435
430
425
420
9
13/04/2015
11:10
9,5
10
10,
5
11
11,
5
12
12,
5
13
13,
5
14
ESTATÍSTICA APLICADA I -xEstatística Descritiva
1.7 Regressão Linear
 Funções linearizáveis
• Solução:
b. Coeficiente de correlação.
13/04/2015
11:10
n
x
y
x2
y2
xy
1
2
3
4
5
6
7
8
10,0
10,5
11,0
11,5
12,0
12,5
13,0
13,5
424
440
447
453
460
465
470
472
100,00
110,25
121,00
132,25
144,00
156,25
160,00
182,25
182329
193600
198809
205209
211600
216225
220900
222284
4270,0
4620,0
4917,0
5209,5
5520,0
5812,5
6110,0
6372,0
Σ
94,0
3.634
1.115,00
1.652.456
42.831,0
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Funções linearizáveis
• Solução:
b. Coeficiente de correlação.
s xy
s yy
94  3.634
 42.831
 131,5
8
( 3.634 ) 2
 1.652.456 
 1.711,5
8
( 94 ) 2
s xx  1.115 
 10 ,5
8
131,5
r
 0 ,98
10 ,5  1.711,5
c. A forma do diagrama de dispersão sugere a curva logaritmica por
suas características.
y = a + b.ln x
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Funções linearizáveis
• Solução:
d. Diagrama de dispersão: a forma linear é y = a + b.X, com X = ln x.
X = ln x
y = oferta
(em 1000 un.
2,30 2,35 2,40 2,44 2,48 2,53 2,56 2,60
427
y
440
447
453
460
465
470
472
475
470
465
460
455
450
445
440
435
430
425
420
2
2,1
2,2
2,3
2,4
2,5
2,6
2,7
2,8
2,9
3
ln x
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Funções linearizáveis
• Solução:
e. Coeficiente de correlação.
13/04/2015
11:10
n
X=ln x
y
X2
y2
Xy
1
2
3
4
5
6
7
8
2,30
2,35
2,40
2,44
2,48
2,53
2,56
2,60
424
440
447
453
460
465
470
472
5,29
2,52
5,76
5,95
6,15
6,40
6,55
6,77
182.329
193.600
198.809
205.209
211.600
216.225
220.900
222.284
982,1
1.034,0
1.072,8
1.105,5
1.140,8
1.176,45
1.203,2
1.227,2
Σ
19,67
3.634
48,45
1.652.456
8.947,57
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Funções linearizáveis
• Solução:
e. Coeficiente de correlação.
s xy
s yy
19,67  3.634
 8.947 ,57 
 11,3453
8
( 3.634 ) 2
 1.652.456 
 1.711,5
8
( 19,67 ) 2
s xx  48,45 
 0 ,0771
8
11,3453
r
 0 ,9879
0 ,0771 1.711,5
f. A correlação obtida com a curva logarítmica é maior; portanto, essa
função será escolhida para o processo de regressão.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Funções linearizáveis
• Solução:
g. Cálculo da regressão linear:
b
a
s xy
s xx

11,3453
 147 ,1505
0 ,0771
 y  b   x  3.634  147,1505 19,67  921907
n
n
8
y  92,1907  147 ,1505. ln x
h. Cálculo do R2.
R2  b 
s xy
s yy
 147,1505
8
11,3453
 0 ,976
1.711,5
A regressão de y sobre x explica 97,6% das variações de y a partir de sua
média; os outros 2,4% são atribuídos a fatores imponderáveis.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
1.7 Regressão Linear
 Funções linearizáveis
• Solução:
i. Projeção da oferta para um preço de 15,00:
y  92,1907  147,1505 ln x  92,1907  147,1505 ln 15  490,68
A oferta esperada quando o preço for 15,00 é de 490,68 mil
unidades.
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva
I - Estatística Descritiva
FIM
13/04/2015
11:10
ESTATÍSTICA APLICADA I - Estatística Descritiva