Transcript Matéria 1

Probabilidade e estatísticaMat013
Professora - Hévilla Nobre Cezar
[email protected]
Mestre em Matemática Aplicada
Universidade Federal de Itajubá – UNIFEI - ICE
Ementa








Estatística descritiva.
Probabilidade.
Distribuição de Probabilidade de variáveis.
discretas e contínuas.
Amostragem.
Distribuição de amostras.
Estimativa pontual e intervalar.
Teste de Hipóteses.
Correlação Linear e regressão.
Objetivo



Dominar os conceitos básicos de estatística e
probabilidade, aplicando-os a situações
rotineiras na área de trabalho;
Usar pacotes gráficos e estatísticos para
agilizar os resultados de uma análise de
dados.
Aprender como tratar estatisticamente os
dados provenientes da área de trabalho.
Bibliografia



Magalhães, M. N. de; Lima, A. C. P.,
Noções de Probabilidade e Estatística,
ed. EDUSP, edição (2004).
Bussab, W. O.; Morettin, P.A.,Estatística
Básica, Editora Saraiva, 4ª edição
(1987).
Triola, M.F., Introdução à Estatística, 7ª
ou 8ª ed., ed.,LTC.
Estatística
Definição: é a ciência que investiga os
processos de obtenção, organização e
análise de dados sobre uma população, e os
métodos de tirar conclusões ou fazer
predições com base nesses dados.
população = universo = espaço amostral
Estatística Descritiva X Estatística Inferencial
Estatística
Estatística Descritiva
S
Estatística
Estatística Descritiva
100
90
80
20
15
70
10
60
5
+
+
50
0
classe 1
S
C la s s e s
10 - 20
20 - 30
30 - 40
40 - 50
50 - 60
60 - 70
70 - 80
80 - 90
90 - 100
100 - 110
110 - 120
120 - 130
F .A .
2
4
6
12
10
25
12
19
7
5
3
1
106
F .R .
0 ,0 2
0 ,0 4
0 ,0 6
0 ,1 1
0 ,0 9
0 ,2 4
0 ,1 1
0 ,1 8
0 ,0 7
0 ,0 5
0 ,0 3
0 ,0 1
classe 2
• média
• moda
• mediana
• desvio médio
• desvio padrão
• assimetria
Estatística

Inferência estatística é a parte da
metodologia da Ciência que tem por
objetivo a coleta, redução, análise e
modelagem dos dados, a partir do que,
finalmente, faz-se a inferência para
uma população da qual os dados foram
obtidos.

Importante - fazer previsões a partir das
quais se podem tomar decisões.
População e amostra
População (universo) = conjunto de todos
os possíveis valores de uma variável ou
característica.
Amostra = conjunto de observações
extraída de uma
população.
Tipos de Variáveis


Qualitativas – apresentam como
possíveis realizações uma qualidade do
indivíduo pesquisado
Quantitativas – apresentam como
possíveis realizações números
resultantes de uma contagem ou
mensuração
Classificação de uma variável
Nominal
Qualitativa
Ordinal
Variável
Quantitativa
Discreta
Contínua
Software Estatístico



Action
Excel
Minitab
Apresentação Gráfica

Para variáveis qualitativas


Gráficos em barra
Gráficos em setores (“pizza”)
Apresentação Gráfica

Para variáveis quantitativas existe uma
variedade de representações gráficas
 Barras
 Colunas
 Gráficos de dispersão
 Histogramas
Gráfico de Setores – para porcentagem
5%
15%
20%
1
2
3
35%
25%
4
5
Distribuição de freqüência
Quando se estuda uma variável, o
maior interesse é conhecer o
comportamento dessa variável,
analisando a ocorrência de suas
possíveis realizações.
Distribuição de freqüência
Análise da variável – grau de instrução
Grau de Freqüência
instrução
Fundamenta
9
Médio
8
Superior
3
Total
20
Proporção
Porcentagem
0,45
0,40
0,15
45
40
15
1,00
100
Freqüência
Freqüência( n ) – número de vezes
que ocorre as realizações.
i
Proporção ou freqüência
relativa


Uma outra medida importante para
análise de uma variável, é a
proporção de cada realização em
relação ao total
Proporção( f ) i
fi 
ni
n
onde n = número total de realizações
Porcentagem
A porcentagem é uma medida útil quando se
quer comparar resultados de duas pesquisas
distintas.
Definição:
Pi  100 f i
Obs: a porcentagem é a freqüência de uma variável
em um total de 100 realizações.
Exemplo 1

Exemplo1
Exemplo
Grau de
instrução
Freqüência
Freqüência
relativa
Porcentagem
Fundamental
9
0.45
45
Médio
8
0.40
40
Superior
Total
3
20
0.15
1.000
15
100.00
Gráfico de freqüências
freqüência
9
8
7
6
5
4
3
2
1
0
fundamental
médio
superior
Medidas de tendência
central
Média, Mediana e Moda.
Medidas de posição
Utilizam-se as medidas de posição
para representar o conjunto de
dados.
 As medidas de posição central são:
 Esperança ou média
 Mediana
 Moda
Média

A Média aritmética de um conjunto de valores
é o valor obtido pela soma dos valores dividida
pelo número de total de valores do conjunto.
x 
x1  ...  x n
n
x – valores distintos de uma variável
n - total de valores do conjunto

1
n
x

n
i 1
i
Média

Quando os valores possuem freqüências
diferentes, definimos a média da seguinte
forma:
n
x  f 1 x1  f 2 x 2  ...  f n x n 

i 1
Onde,
f i é a freqüência relativa
x i é o valor da variável
f i xi
Mediana

A mediana de um conjunto de valores
é o valor do meio desse conjunto,
quando os valores estão dispostos em
ordem crescente (ou decrescente).



md ( X )   x 
 


x


n 

2 
n 1 

2 
 x
n

1 

 2

2
Se n ímpar
Se n par
Moda
A moda de um conjunto de valores é
o valor que ocorre com maior
freqüência.


Se dois valores ocorrem com mesma
freqüência máxima, dizemos que o
conjunto é bimodal.
Se mais de dois valores ocorrem com
mesma freqüência máxima, dizemos
que o conjunto é multimodal.
Exemplo – variável
discreta
Número
Número de filhos
1
0

2
0

3
1
4
1
5
1
6
1
7
2
8
2
9
2
10
3
11
3
12
4

Moda = 1
Mediana = 1+2/2=1.5
Média = 20/12 = 1.666
Exemplo – variável contínua
Classes de
Salários
Ponto
médio
Freqüência
Freqüência
relativa
[4.00 , 8.00)
[8.00 , 12.00)
[12.00 , 16.00)
[16.00 , 20.00)
[20.00 , 24.00)
6.00
10.00
14.00
18.00
22.00
10
12
8
5
1
0,2778
0,3334
0,2222
0,1389
0,0278
Total
-
36
1,0000
Moda = 10,00
Mediana = 10,00
Média = 6.00 x 0,2778 + 10.00 x 0,3334 + 14.00 x 0,2222 + 18.00 x 0.1389 +
22.00 x 0,0278 = 11,22
Outras medidas de posição
Quartis, Decis e Percentis

A média e a moda podem não ser medidas
adequadas para representar um conjunto de
dados, pois:
 São afetadas por valores extremos;
 Apenas com esses dois valores não temos
idéia da simetria da distribuição dos dados.
Para contornar esses fatos, consideramos
outras medidas de posição.
Quartis, Decis e Percentis
São medidas de posição
convenientes para comparar
valores dentro de um mesmo
conjunto de dados, ou entre
conjuntos de dados diferentes.
Quartis


É uma medida de posição que divide
as observações (ordenadas em ordem
crescente) em quatro grupos.
Dessa forma, temos três quartis
denotados por Q 1 , Q 2 e Q 3 .
Quartis



- separa os 25% inferiores dos 75%
superiores dos valores
ordenados
Q1
Q2
- é a mediana
- separa os 75% inferiores dos 25%
superiores dos valores
ordenados
Q3
Decis


É uma medida de posição que divide as
observações em 10 grupos com cerca
de 10% das observações em cada
grupo.
Demotamos os decis por:
D1 - 10%, D2 - 20%, D3 - 30% , D4 - 40%, D5
- 50% ,
D6 - 60%, D7 - 70%, D8 - 80% e D9 - 90%
Percentis


Divide os dados em 100 grupos com
cerca de 1% em cada grupo.
Denotamos por:
P1 - 1%, P2 - 2%, , P3 - 3%, ... , P99 99%.