Transcript Matéria 1
Probabilidade e estatísticaMat013
Professora - Hévilla Nobre Cezar
[email protected]
Mestre em Matemática Aplicada
Universidade Federal de Itajubá – UNIFEI - ICE
Ementa
Estatística descritiva.
Probabilidade.
Distribuição de Probabilidade de variáveis.
discretas e contínuas.
Amostragem.
Distribuição de amostras.
Estimativa pontual e intervalar.
Teste de Hipóteses.
Correlação Linear e regressão.
Objetivo
Dominar os conceitos básicos de estatística e
probabilidade, aplicando-os a situações
rotineiras na área de trabalho;
Usar pacotes gráficos e estatísticos para
agilizar os resultados de uma análise de
dados.
Aprender como tratar estatisticamente os
dados provenientes da área de trabalho.
Bibliografia
Magalhães, M. N. de; Lima, A. C. P.,
Noções de Probabilidade e Estatística,
ed. EDUSP, edição (2004).
Bussab, W. O.; Morettin, P.A.,Estatística
Básica, Editora Saraiva, 4ª edição
(1987).
Triola, M.F., Introdução à Estatística, 7ª
ou 8ª ed., ed.,LTC.
Estatística
Definição: é a ciência que investiga os
processos de obtenção, organização e
análise de dados sobre uma população, e os
métodos de tirar conclusões ou fazer
predições com base nesses dados.
população = universo = espaço amostral
Estatística Descritiva X Estatística Inferencial
Estatística
Estatística Descritiva
S
Estatística
Estatística Descritiva
100
90
80
20
15
70
10
60
5
+
+
50
0
classe 1
S
C la s s e s
10 - 20
20 - 30
30 - 40
40 - 50
50 - 60
60 - 70
70 - 80
80 - 90
90 - 100
100 - 110
110 - 120
120 - 130
F .A .
2
4
6
12
10
25
12
19
7
5
3
1
106
F .R .
0 ,0 2
0 ,0 4
0 ,0 6
0 ,1 1
0 ,0 9
0 ,2 4
0 ,1 1
0 ,1 8
0 ,0 7
0 ,0 5
0 ,0 3
0 ,0 1
classe 2
• média
• moda
• mediana
• desvio médio
• desvio padrão
• assimetria
Estatística
Inferência estatística é a parte da
metodologia da Ciência que tem por
objetivo a coleta, redução, análise e
modelagem dos dados, a partir do que,
finalmente, faz-se a inferência para
uma população da qual os dados foram
obtidos.
Importante - fazer previsões a partir das
quais se podem tomar decisões.
População e amostra
População (universo) = conjunto de todos
os possíveis valores de uma variável ou
característica.
Amostra = conjunto de observações
extraída de uma
população.
Tipos de Variáveis
Qualitativas – apresentam como
possíveis realizações uma qualidade do
indivíduo pesquisado
Quantitativas – apresentam como
possíveis realizações números
resultantes de uma contagem ou
mensuração
Classificação de uma variável
Nominal
Qualitativa
Ordinal
Variável
Quantitativa
Discreta
Contínua
Software Estatístico
Action
Excel
Minitab
Apresentação Gráfica
Para variáveis qualitativas
Gráficos em barra
Gráficos em setores (“pizza”)
Apresentação Gráfica
Para variáveis quantitativas existe uma
variedade de representações gráficas
Barras
Colunas
Gráficos de dispersão
Histogramas
Gráfico de Setores – para porcentagem
5%
15%
20%
1
2
3
35%
25%
4
5
Distribuição de freqüência
Quando se estuda uma variável, o
maior interesse é conhecer o
comportamento dessa variável,
analisando a ocorrência de suas
possíveis realizações.
Distribuição de freqüência
Análise da variável – grau de instrução
Grau de Freqüência
instrução
Fundamenta
9
Médio
8
Superior
3
Total
20
Proporção
Porcentagem
0,45
0,40
0,15
45
40
15
1,00
100
Freqüência
Freqüência( n ) – número de vezes
que ocorre as realizações.
i
Proporção ou freqüência
relativa
Uma outra medida importante para
análise de uma variável, é a
proporção de cada realização em
relação ao total
Proporção( f ) i
fi
ni
n
onde n = número total de realizações
Porcentagem
A porcentagem é uma medida útil quando se
quer comparar resultados de duas pesquisas
distintas.
Definição:
Pi 100 f i
Obs: a porcentagem é a freqüência de uma variável
em um total de 100 realizações.
Exemplo 1
Exemplo1
Exemplo
Grau de
instrução
Freqüência
Freqüência
relativa
Porcentagem
Fundamental
9
0.45
45
Médio
8
0.40
40
Superior
Total
3
20
0.15
1.000
15
100.00
Gráfico de freqüências
freqüência
9
8
7
6
5
4
3
2
1
0
fundamental
médio
superior
Medidas de tendência
central
Média, Mediana e Moda.
Medidas de posição
Utilizam-se as medidas de posição
para representar o conjunto de
dados.
As medidas de posição central são:
Esperança ou média
Mediana
Moda
Média
A Média aritmética de um conjunto de valores
é o valor obtido pela soma dos valores dividida
pelo número de total de valores do conjunto.
x
x1 ... x n
n
x – valores distintos de uma variável
n - total de valores do conjunto
1
n
x
n
i 1
i
Média
Quando os valores possuem freqüências
diferentes, definimos a média da seguinte
forma:
n
x f 1 x1 f 2 x 2 ... f n x n
i 1
Onde,
f i é a freqüência relativa
x i é o valor da variável
f i xi
Mediana
A mediana de um conjunto de valores
é o valor do meio desse conjunto,
quando os valores estão dispostos em
ordem crescente (ou decrescente).
md ( X ) x
x
n
2
n 1
2
x
n
1
2
2
Se n ímpar
Se n par
Moda
A moda de um conjunto de valores é
o valor que ocorre com maior
freqüência.
Se dois valores ocorrem com mesma
freqüência máxima, dizemos que o
conjunto é bimodal.
Se mais de dois valores ocorrem com
mesma freqüência máxima, dizemos
que o conjunto é multimodal.
Exemplo – variável
discreta
Número
Número de filhos
1
0
2
0
3
1
4
1
5
1
6
1
7
2
8
2
9
2
10
3
11
3
12
4
Moda = 1
Mediana = 1+2/2=1.5
Média = 20/12 = 1.666
Exemplo – variável contínua
Classes de
Salários
Ponto
médio
Freqüência
Freqüência
relativa
[4.00 , 8.00)
[8.00 , 12.00)
[12.00 , 16.00)
[16.00 , 20.00)
[20.00 , 24.00)
6.00
10.00
14.00
18.00
22.00
10
12
8
5
1
0,2778
0,3334
0,2222
0,1389
0,0278
Total
-
36
1,0000
Moda = 10,00
Mediana = 10,00
Média = 6.00 x 0,2778 + 10.00 x 0,3334 + 14.00 x 0,2222 + 18.00 x 0.1389 +
22.00 x 0,0278 = 11,22
Outras medidas de posição
Quartis, Decis e Percentis
A média e a moda podem não ser medidas
adequadas para representar um conjunto de
dados, pois:
São afetadas por valores extremos;
Apenas com esses dois valores não temos
idéia da simetria da distribuição dos dados.
Para contornar esses fatos, consideramos
outras medidas de posição.
Quartis, Decis e Percentis
São medidas de posição
convenientes para comparar
valores dentro de um mesmo
conjunto de dados, ou entre
conjuntos de dados diferentes.
Quartis
É uma medida de posição que divide
as observações (ordenadas em ordem
crescente) em quatro grupos.
Dessa forma, temos três quartis
denotados por Q 1 , Q 2 e Q 3 .
Quartis
- separa os 25% inferiores dos 75%
superiores dos valores
ordenados
Q1
Q2
- é a mediana
- separa os 75% inferiores dos 25%
superiores dos valores
ordenados
Q3
Decis
É uma medida de posição que divide as
observações em 10 grupos com cerca
de 10% das observações em cada
grupo.
Demotamos os decis por:
D1 - 10%, D2 - 20%, D3 - 30% , D4 - 40%, D5
- 50% ,
D6 - 60%, D7 - 70%, D8 - 80% e D9 - 90%
Percentis
Divide os dados em 100 grupos com
cerca de 1% em cada grupo.
Denotamos por:
P1 - 1%, P2 - 2%, , P3 - 3%, ... , P99 99%.