Slide 1 - CTEC - Universidade Federal de Alagoas

Download Report

Transcript Slide 1 - CTEC - Universidade Federal de Alagoas

Distribuição de Probabilidades
Aula 04
Prof. Christopher Freire Souza
Centro de Tecnologia
Universidade Federal de Alagoas
www.ctec.ufal.br/professor/cfs
2
Christopher Souza:
Distribuição de
probabilidades
Objetivos
• Promover o entendimento do que são modelos
de distribuição de probabilidade
• Desenvolver habilidades para identificar quais
modelos devem ser aplicados para cada estudo
• Desenvolver habilidades para elaborar modelos
de distribuição de probabilidade.
3
Christopher Souza:
Distribuição de
probabilidades
Relevância do conteúdo
• Um modelo de distribuição de probabilidades
pode ser usado para interpolar ou extrapolar
probabilidades ou quantis não contidos nas
observações amostrais.
4
Christopher Souza:
Distribuição de
probabilidades
Conteúdo
•
•
•
•
Fundamentos
Variáveis discretas
Variáveis contínuas
Estatísticas Amostrais
5
Christopher Souza:
Distribuição de
probabilidades
Fundamentos
• Conceitos
• Parâmetros
• Distribuições
6
Christopher Souza:
Distribuição de
probabilidades
Fundamentos (Conceitos)
• Variáveis aleatórias – Têm um único valor numérico
para cada resultado de um experimento.
▫ Discretas – Assumem apenas valores inteiros.
▫ Contínuas – Podem assumir valor mensurável em escala
contínua, i.e., sem saltos ou interrupções.
• Distribuição de probabilidades – descrição que
apresenta a probabilidade para cada valor da variável
aleatória.
▫ Observe que para todo valor individual de x, 0≤P(x) ≤1 e que para
todos os valores possíveis de x,
.
▫ A distribuição de probabilidade é freqüentemente expressa por
um gráfico, tabela ou equação.
7
.,
Christopher Souza:
Distribuição de
probabilidades
Fundamentos (Conceitos)
• Função massa de
probabilidade
▫ Indica com que probabilidade
a variável aleatória x assume
o valor xo, i.e., P(x=xo) =
fx(xo).
▫ A função massa de
probabilidade se aplica a
variáveis discretas.
• Função densidade de
probabilidade
▫ Equivale à função massa de
probabilidade, sendo que se
aplica a variáveis contínuas.
8
.,
Christopher Souza:
Distribuição de
probabilidades
Fundamentos (Conceitos)
• Função de distribuição
acumulada de probabilidades
▫ Indica com que probabilidade
a variável x é menor ou igual
ao valor xo, i.e.,
ou
9
Christopher Souza:
Distribuição de
probabilidades
Fundamentos (Conceitos)
• Modelos de distribuição
de probabilidades
▫ Equações (P(x=x0)=f(x,q1,
q2,..., qn)) que sintetizam o
comportamento de variáveis
aleatórias (x) quanto à
probabilidade de ocorrência
de seus valores (x0).
 Os coeficientes das equações
(q1, q2,..., qn) possibilitam a
particularização de seu uso
para uma amostra de dados.
Distribuição Normal
10
Christopher Souza:
Distribuição de
probabilidades
Fundamentos (Parâmetros)
• Particularização de modelos de distribuição por meio da
estimação de coeficientes, a partir da estimação dos
parâmetros pelo cálculo da esperança matemática
• Esperança matemática, também conhecida como valor
esperado (E[x] ou μ), representa o valor médio de uma
variável aleatória x, calculado com as probabilidades de
ocorrência dos valores de x como ponderadores
11
Christopher Souza:
Distribuição de
probabilidades
Esperança Matemática
(Propriedades)
•
•
•
•
•
E[c]=c
E[g(X)]=∑g(xi).pX(xi) ou E[g(X)]= ∫g(xi).fX(xi)dx
E[c.g(X)]=c.E[g(X)]
E[c1.g1(X)± c2.g2(X)]=c1.E[g1(X)] ± c2.E[g2(X)]
E[g1(X)]≥E[g2(X)], se g1(X)≥g2(X)
• Estimativa de parâmetros por meio da formulação:
Parâmetro
a
k
Média
0 1
Variância
m 2
Assimetria m 3
Curtose
m 4
12
Christopher Souza:
Distribuição de
probabilidades
Esperança Matemática
(Propriedades)
•
•
•
•
•
•
•
•
m1=E[X]=∑ xi.pX(xi)
m2=Var[X]=s2X=E[(X-m1)2]=E[(X-E[X])2]=E[X2]–(E[X])2
Var[c]=0
Var[c.X]=c2.Var[X]
Var[c.X+d]= c2.Var[X]
Cov[X,Y]=sXY=E[(X-mX) (Y-mY)]=E(XY) –mX.mY
Var[X±Y]= Var[X]+ Var[Y] ±2Cov[X,Y]
|sXY |≤sX.sY
13
Christopher Souza:
Distribuição de
probabilidades
Função geratriz de momentos
• Função geratriz
• Primeiro momento:
• Expansão por
série de Maclaurin
14
Christopher Souza:
Distribuição de
probabilidades
Modelos para variáveis discretas
•
•
•
•
•
Binomial
Geométrica
Pascal ou Binomial Negativa
Poisson
Uniforme
15
Christopher Souza:
Distribuição de
probabilidades
Distribuição binomial
• Experimento de Bernoulli: resulta
em apenas um dos 2 tipos de
respostas as quais são
dicotômicas.
▫ xi={0,1}
▫ Ex: sim/não, chuva/não-chuva,
inunda/não-inunda
• Processo de Bernoulli: resulta da
repetição de experimentos de
Bernoulli, cujos resultados são
independentes e “p” é a
probabilidade de obter o resultado
“sucesso”
▫ P(q≥q0)=p, e logo, P(q<q0)=1-p
Naghettini & Pinto 2007, pg 103
16
Christopher Souza:
Distribuição de
probabilidades
Distribuição binomial
• Considere y=número de
“sucessos” em n repetições do
experimento
▫ y=∑xi={0,1,2,3,…,n}
• Supondo que o interesse é
analisar a probabilidade de
obter y0 “sucessos” em n
observações, tem-se:
▫ Resultados independentes e
ordem não importa
(combinação)
▫ Observe que os coeficientes
são “p” e “n”
17
Christopher Souza:
Distribuição de
probabilidades
Distribuição binomial
• Função acumulada de
probabilidades (fap):
• Valor Esperado:
▫ E(y)=np
• Variância:
▫ VAR[y]=np(1-p)
• Assimetria:
18
Christopher Souza:
Distribuição de
probabilidades
Distribuição binomial
• Confiabilidade
▫ Probabilidade de não ocorrer “sucesso” em um período
de n intervalos de tempo
▫ P(y=0)=(1-p)n
• Risco
▫ Probabilidade de ocorrer pelo menos um “sucesso” em
um período de n intervalos de tempo
▫ R=1-P(y=0)=1-(1-p)n
19
Christopher Souza:
Distribuição de
probabilidades
Distribuição geométrica
• Em hidrologia é usual o interesse em estimar o número
médio de experimentos (observações) para que se
obtenha o primeiro “sucesso”
▫ w=número de experimentos de Bernoulli necessários para
obtenção do primeiro “sucesso”
• Portanto, se a variável w assume o valor wo, isso significa
que ocorreram (wo -1) “falhas” antes da ocorrência do
“sucesso”, exatamente no wo-ésimo experimento.
• Neste caso, a função densidade de probabilidade assume
a equação:
20
Christopher Souza:
Distribuição de
probabilidades
Distribuição geométrica
• Função acumulada de probabilidades (fap):
• Valor Esperado:
▫ E(w)=1/p
• Variância:
• Assimetria:
21
Christopher Souza:
Distribuição de
probabilidades
Distribuição geométrica
• Tempo de retorno (Tr)
▫ Conceito: Intervalo médio de recorrência (ARI) de
“sucesso” é obtido do cálculo de E[w]
 Se o intervalo de dados for anual, Tr é expresso em anos
▫ Para o estudo de recorrência de mínimas, estima-se o
tempo de retorno por Tr=1/(1-p), dado que p=P(q≥q0)
• Risco hidrológico
▫ Utilizando o conceito de risco apresentado tem-se:
▫ R=1-P(y=0)=1-(1-1/Tr)n, para estudo de cheias
▫ R=1-P(y=0)=1-(1/Tr)n, para estudo de estiagens
22
Christopher Souza:
Distribuição de
probabilidades
Distribuição binomial negativa
(Pascal)
• Permite estimar a probabilidade de ocorrência do y0ésimo “sucesso” na n-ésima repetição de um
experimento de Bernoulli
• Formulação composta pela estimativa da probabilidade
de obter
▫ (y0-1) “sucessos” em (n-1) observações, e
▫ “sucesso” na próxima observação
• O termo “negativa” vem da inversão do interesse de
análise (número de observações para “y0” “sucessos”) em
relação à distribuição binomial (número de “sucessos”
para “n” observações)
23
Christopher Souza:
Distribuição de
probabilidades
Distribuição binomial negativa
(Pascal)
• Função massa de
probabilidades (fmp)
• Valor Esperado:
▫ E(n)=y0/p
• Variância:
r=(n-1)-(y0-1); k=y0-1;
r=no. de falhas antes do y0-ésimo sucesso
24
Christopher Souza:
Distribuição de
probabilidades
Distribuição de Poisson
• Processo de Poisson: contagem de “sucessos” em
intervalo (de tempo ou comprimento) que pode ser
subdividido em subintervalos suficientemente pequenos
tal que:
▫ A probabilidade de mais de um “sucesso” em um
subintervalo seja zero
▫ A probabilidade de um “sucesso” em um subintervalo seja a
mesma para todos os subintervalos e proporcional ao
número de subintervalos
▫ O sucesso em cada subintervalo seja independente de
observações em outros subintervalos
25
Christopher Souza:
Distribuição de
probabilidades
Distribuição de Poisson
• Para n>50 e p <0,1, Poisson → binomial.
• Variável aleatória de Poisson (y) designa o número de
“sucessos” para n observações (subintervalos), i.e.,
intervalo em análise.
• Mostra-se necessário conhecer apenas o número
esperado (q1) de “sucessos” para o, intervalo em análise.
• FMP:
26
Christopher Souza:
Distribuição de
probabilidades
Distribuição de Poisson
• FAP:
• E[y]=VAR[y]= q1
• Assimetria:
27
Christopher Souza:
Distribuição de
probabilidades
Distribuição Uniforme
• Processo eqüiprovável
com n resultados
possíveis:
▫ P(x=xo) =1/n, onde
a≤x≤b, sendo a e b os
valores extremos de x e
n=(b-a+1)
• FAP:
• E[x]=(a+b)/2
28
Christopher Souza:
Distribuição de
probabilidades
Modelos para variáveis contínuas
•
•
•
•
•
•
•
•
Uniforme
Normal
Log-Normal
Exponencial
Erlang
Gama
Pearson
Distribuições de valores extremos
▫ Exatas
▫ Assíntoticas
 Máximas (Gumbel, Fréchet, GEV)
 Mínimas (Gumbel, Weibull, GEV)
29
Christopher Souza:
Distribuição de
probabilidades
Distribuição Uniforme
• Processo eqüiprovável
com “n” resultados
possíveis:
▫ P(limx=xox) =1/n, onde
a≤x≤b, sendo a e b os
valores extremos de x e
n=(b-a+1)
• FAP:
• E[x]=(a+b)/2
30
Distribuição Uniforme
Christopher Souza:
Distribuição de
probabilidades
• Geração de números aleatórios para
qualquer modelo de distribuição
▫ Define-se a=0 e b=1, que equivalem ao
intervalo de valores possíveis de probabilidade.
▫ Gera-se números aleatórios (“rand”) para o
intervalo [a,b].
▫ Aplicam-se os valores obtidos nas f-1(x) do
modelo de distribuição que se quer ter números
aleatórios gerados, como se fossem
probabilidades.
• “Simulação de Monte Carlo”
▫ Estudo de sensibilidade de modelos à definição
de coeficientes
▫ Repete-se a geração de números aleatórios para
servir de coeficiente de modelos numéricos
31
Christopher Souza:
Distribuição de
probabilidades
Distribuição Normal
• Variável aleatória com
variação simétrica
▫ q2 = m= parâmetro de
posição
▫ q1 = s= parâmetro de
escala
• FDP:
• FAP:
32
Christopher Souza:
Distribuição de
probabilidades
Distribuição Normal
• Aplicações em hidrologia
▫ vazões médias anuais de
pequenas bacias com
pequenos aqüíferos
▫ alturas anuais de precipitação
onde a sazonalidade seja
pouco marcada e onde não
exista prevalência de
precipitações de origem frontal
• Distribuição Normal
padrão (m=0, s=1) - Tabela
• Escore z
33
Christopher Souza:
Distribuição de
probabilidades
Distribuição Normal
(Binomial pela Normal)
• Aplica-se se np≥5 e n(1-p) ≥5
• Correção para continuidade
▫ usa-se o intervalo x-0,5 a x+0,5
na distribuição normal como um
representante do valor discreto x
na distribuição binomial
▫ Ex: P(x>15), onde x segue a
distribuição binomial, com m e s
conhecidos?
 P (x>15,5) pela distribuição
normal, via escore z
34
Christopher Souza:
Distribuição de
probabilidades
Distribuição Normal
(Teorema central do limite)
• Dada a disponibilidade de “n” dados • Quanto maior “n”, maior a
da variável aleatória independente
aproximação da distribuição
x, com média µ, desvio σ e
de médias amostrais da
distribuição não exageradamente
distribuição normal.
não-normal, a distribuição de
• Se x~N(m,s), a aplicação do
médias de “m” valores de x segue a
teorema independe de “n”.
distribuição normal com média µ e • Se n≈30, obtém-se uma
desvio σ/ se “n” for grande o
aproximação razoável à
suficiente
normal
• Para x muito não-normal,
sugere-se n >>30.
• Quando n>0,05N, recomendase usar como desvio
35
Christopher Souza:
Distribuição de
probabilidades
Distribuição Normal
(Transformações normalizantes)
• Equação de Box-Cox:
▫ onde i designa a posição do
dado na amostra e x a potência
normalizante. Quando x tende
a zero, a transformação se
aproxima da aplicação de ln.
• Um critério para examinar o
valor de x pode ser avaliar
quando g≈0.
• Transformações modificam a
magnitude e a escala da
informação que estes contêm e
por esta razão qualquer análise
posterior deve ser
transformada de volta.
• Técnicas para avaliar o ajuste
de dados a uma distribuição,
inclusive como determinar se
há normalidade para os dados
originais ou transformados,
serão apresentados no
próximo tópico.
36
Christopher Souza:
Distribuição de
probabilidades
Distribuição Log-normal
• Aplicações em hidrologia
▫ estudo de cheias e estiagens, do
tamanho de sedimentos e de
gotas de chuva
• Se x está em análise e y=ln(x)
atende critérios do teorema do
limite central, y~N(my,sy)
• FDP:
• Esperança, Variância, CV e
Assimetria
37
Christopher Souza:
Distribuição de
probabilidades
Distribuição Log-Normal-3
.
• Um 3o coeficiente (q4) pode ser
utilizado para permitir melhor
ajuste:
▫ y=ln(x- q4)~N(my,sy)
• FAP:
• Esperança, Variância,
Assimetria
• onde
38
Christopher Souza:
Distribuição de
probabilidades
Distribuição Exponencial
• Se subintervalos de Poisson forem muito pequenos, a variável w que
designa tais intervalos pode ser considerada contínua.
• A probabilidade de que se tenha w0 intervalos até que o próximo
“sucesso” ocorra pode ser estimado por uma distribuição de Poisson
para y=0.
▫ Onde q1=l.w0 e l é a razão média de “sucessos” por subintervalo
• Tal distribuição se comporta como a distribuição geométrica
39
Christopher Souza:
Distribuição de
probabilidades
Distribuição Exponencial
• FAP:
• FDP:
40
Christopher Souza:
Distribuição de
probabilidades
Distribuição Erlang
• Serve à estimativa do q3-ésimo
sucesso para w0 (q1)
subintervalos, assim como a
distribuição binomial negativa
servia a variáveis discretas.
• Para q3 =1, a distribuição obtida é
a exponencial
• Para q3 >>0, a distribuição obtida
se aproxima da Normal
41
Christopher Souza:
Distribuição de
probabilidades
Distribuição Gama
• Aplicações em hidrologia
▫ precipitação diária, semanal,
mensal e anual e de vazões
médias anuais.
• Supondo que o número de
“sucessos” (q3) seja computado
como uma variável contínua,
substitui-se (q3-1)! pela função
gama
• FDP:
• Esperança e Variância estimadas
como na função Erlang
42
Christopher Souza:
Distribuição de
probabilidades
Distribuição Gama-3
• Um 3o coeficiente (q4) pode ser
utilizado para permitir melhor
ajuste da função Gama aos
dados
• FAP:
43
Christopher Souza:
Distribuição de
probabilidades
Distribuição Pearson
• Distribuições Pearson podem representar oito grandes famílias de
distribuição, incluindo a Normal, a Gama e a Beta.
• Pearson tipo III (Gama-3) apresenta o maior número de aplicações
no estudo de freqüência de variáveis hidrológicas, com destaque
para vazões e precipitações máximas anuais.
▫ Log-Pearson III = Pearson III (log(x)).
▫ Log-Pearson III ~ log-normal, para g=0.
▫ Para g<0, a distribuição apresenta um limite superior que pode limitar a
estimativa para valores extremos de vazões máximas
44
Christopher Souza:
Distribuição de
probabilidades
Distribuições de valores extremos
• Exatas
• Assintóticas
▫ Máximas (Gumbel, Fréchet, GEV)
▫ Mínimas (Gumbel, Weibull, GEV)
45
Christopher Souza:
Distribuição de
probabilidades
Distribuição exata de valores
extremos
• Valores extremos (máximos ou mínimos) de uma amostra são
também variáveis aleatórias com distribuições próprias relacionadas
à distribuição da variável aleatória original.
• Para yi = max(xji), FAP:
▫ FDP:
46
Christopher Souza:
Distribuição de
probabilidades
Distribuição exata de valores
extremos
• Para mínimos, FDP:
▫ FAP:
• Poucas são as distribuições com expressões analíticas de fácil
dedução e por essa razão aproximações quanto à forma da
distribuição precisam ser trabalhadas
▫ Ex: P(x=x0), para n ∞.
47
Christopher Souza:
Distribuição de
probabilidades
Distribuições assintóticas de
valores extremos
• Independentemente da
distribuição da variável
aleatória original, as FAPs de
seus valores extremos podem
convergir para formas
funcionais
• Classificação de formas
Tipo
assintóticas:
▫ Tipo I: forma dupla
exponencial, não existindo
valor limite.
▫ Tipo II: forma exponencial
simples.
▫ Tipo III: forma exponencial
com limite.
I
II
III
I
II
III
Distribuição da variável original
Valores máximos
Exponencial, Gama, Normal, Log-Normal ou máximos do tipo I
Log-Pearson III, t de Student ou máximos do tipo II
Uniforme, Beta ou máximos do tipo III
Valores mínimos
Normal ou mínimos do tipo I
t de Student ou mínimos do tipo II
Uniforme, Exponencial, Beta, Log-Normal, Gama ou mínimos do tipo III
48
Christopher Souza:
Distribuição de
probabilidades
Distribuição Gumbel
(máximos)
• Aplicações em hidrologia
▫ relações intensidade-duraçãofreqüência de precipitações
intensas e vazões de enchentes.
• FDP:
• FAP:
• Esperança, Variância e
Assimetria
• Inversa
49
Christopher Souza:
Distribuição de
probabilidades
Distribuição Fréchet
(máximos)
• Conhecida como log-Gumbel
• Aplicações em hidrologia
▫ Eventos hidrológicos máximos.
• FDP:
• FAP:
• Esperança, Variância e CV
• Inversa
50
Christopher Souza:
Distribuição de
probabilidades
Distribuição GEV
• Incorpora as três formas
assintóticas
 se q30, a GEV representa a
distribuição do tipo I (Gumbel).
 se q3>0, a GEV representa a
distribuição do tipo II (Fréchet),
definida para
 se q3<0, a GEV representa a
distribuição do tipo III (Weibull),
definida para
• FDP:
• FAP:
• Esperança (para
)
• Variância (para
)
• Assimetria
• Inversa
51
Christopher Souza:
Distribuição de
probabilidades
Distribuição Gumbel
(mínimos)
• Conhecida como log-Weibull
• FDP:
• FAP:
• Esperança, Variância e
Assimetria
• Inversa
52
Christopher Souza:
Distribuição de
probabilidades
Distribuição Weibull
(mínimos)
• FDP (para z0>q2, q1≥0 e q3 ≥0):
• FAP:
• Esperança (para q3 >1):
• Variância (para q3 >2):
• Assimetria
• Inversa
53
Christopher Souza:
Distribuição de
probabilidades
Distribuições de estatísticas amostrais
• Prerrogativas:
▫ Variáveis originais atendem aos critérios para aplicação do
teorema central do limite
▫ Variáveis aleatórias e independentes
• Modelos:
▫ t de Student
▫ c2
▫ F de Snedecor
54
Christopher Souza:
Distribuição de
probabilidades
Distribuição t de Student
• Aplicação para médias
quando:
▫ não se conhece a variância
populacional
▫ não se tem uma amostra com
30 ou mais dados
• Variável aleatória:
• FDP:
• Esperança:
• Variância:
▫ para n=n-1 e n>2
55
Christopher Souza:
Distribuição de
probabilidades
Distribuição c²
• Aplicação para variâncias
• Variável aleatória:
• FDP (~gama(0,5; n/2)):
• FAP:
• Esperança:
• Variância:
• Assimetria:
56
Christopher Souza:
Distribuição de
probabilidades
Distribuição F
• Aplicação para comparação de
variâncias
• Variável aleatória:
▫ Para std1>std2
• FDP (p/ n1,n2 e F0>0):
• Esperança: