distribución de valor extremo

Download Report

Transcript distribución de valor extremo

ANALISIS DE FRECUENCIA EN HIDROLOGIA (3)

Profesor Luis F. Carvajal Universidad Nacional de Colombia Facultad de Minas Escuela de Geociencias y Medio Ambiente

Distribuciones de Probabilidad

Distribuciones discretas – Distribución Binomial – Distribución Poisson – Distribución Geométrica • Distribuciones continuas – Distribución Exponencial – Distribución Normal – Distribución Log Normal – Distribución Gamma – Distribución Log Pearson tipo III – Distribución General de Valor Extremo

DISTRIBICIONES DE PROBABILIDAD DISCRETA

Distribución Binomial

1.

2.

3.

Un ejemplo de los ensayos de Bernoulli es lanzar una moneda. Los ensayos operan bajo tres condiciones: Cualquier ensayo solo puede tener uno o dos posibles resultados, éxito o falla, llueve o no llueve.

Ensayos sucesivos son independientes.

Las probabilidades son constantes.

Bajo estas tres condiciones la probabilidad de x éxitos en n ensayos, está dada por la distribución Binomial como:

p

(

x

)   

n x

 

p x q n

x

Donde:  

n x

  Es el número de combinaciones de n eventos tomando x a la vez.

n x

x

!

(

n n

!

x

)!

p es la probabilidad de ocurrencia de un evento, por ejemplo la probabilidad de éxito en lanzar una moneda, q es la probabilidad de falla.

q

 1 

p

x es la variable o el número de ensayos con éxito.

Ejemplo: Distribución Binomial

Suponga que una presa tiene una vida útil de 50 años y se desea evaluar la probabilidad que una inundación, con un periodo de retorno de 100 años, ocurra una vez durante la vida útil de la presa.

p

 1 /

T q

 1   0 .

01

p

 0 .

99

x

 1

n

 50

p

( 1 )    50 1   0 .

1 1 0 .

99 49  0 .

306 Por lo tanto, es alrededor de 31% de probabilidad que un evento de tal magnitud pueda ocurrir una vez en la vida útil de la presa

Distribución Poisson

Una expansión binomial es un pequeño inconveniente para calcular números grandes.

• P es pequeño (p < 0.1) • n es grande (n > 30) • La media np es constante.

• p  0, q  1, n  ∞ (

p

q

)

n

e

  

e

 

e

   

e

    2

e

  2 !

 .....

Esta es conocido como la expansión Poisson y es generalmente escrita como:

p

(

x

)  

x e x

!

 

Donde:  = np es la media.

La distribución binomial finita distribución Poisson infinita, siempre que se apliquen las siguientes 4 condiciones: puede ser aproximada por la 1.

2.

3.

4.

Número de eventos es discreto Dos eventos no pueden coincidir La media del número de eventos en el tiempo es constante Los eventos son independientes

Ejemplo: Distribución Poisson

Tomando el ejemplo anterior, la probabilidad que una inundación con periodo de retorno de 100 años pueda ocurrir una vez en 50 años será:

p

( 1 )  0 .

5 1

e

 0 .

5 1 !

 0 .

303 Comparado con el resultado de la distribución binomial, p(1) = 0.306, es similar.

Distribución Geométrica

RECORDANDO: En una secuencia de Bernoulli, el número de ensayos hasta que un evento específico ocurra por primera vez es modelado por la distribución geométrica.

Éxito Falla   ensayo t + n ensayo t – 1 Si T  v.a. apropiada:

P

(

T

t

) 

pq T

 1

t

 1 , 2 , ....

Periodo de retorno

Tiempo de recurrencia promedio para que un evento de cierta magnitud sea igualado o excedido.

DISTRIBICIONES DE PROBABILIDAD CONTINUA

Distribución Exponencial

Consideraciones: • Proceso de eventos aleatorios (los parámetros no cambian con el tiempo).

• No es posible tener mas de un evento en cualquier instante.

• Descripción de un proceso Poisson.

• La v.a.

t representa el tiempo entre tormentas.

Función de Densidad: La media es: La varianza es:

f

(

t

)

E

(

t

)   

e

 

t

1 /  , t  0  2 (

t

)  1 /  2 La función de distribución acumulada es:

F

(

t

)   0

t

e

 

t d

  1 

e

 

t

Ejemplo: Distribución exponencial

En un año en un sitio determinado ocurren 110 tormentas independientes con una duración promedio (todas) de 5.3 h. El intervalo entre tormentas es:

t

 8760  110  5 .

3  74 .

3

h

110  = 1/ λ λ = 1/74.3 = 0.0135 h -1 a) Cuál es la probabilidad de que pasen al menos 4 días (96 h) entre tormentas?

P(t  96) =1- F(96)

F

( 96 )  96 0  

e

 

t dt P

(

t

 1 

e

 

t

 96 )  1  1 

e

 

t

e

 0 .

0135 * 96  0 .

27

b) Cual es la probabilidad de que el tiempo entre dos tormentas sea exactamente 12 horas?

P(t = 12)= 0 la probabilidad que una V.A continua valga cero en un intervalo es cero. c) Cual es la probabilidad que la separación entre 2 tormentas sea menor o igual que 12 h?

Distribución Log Normal

En general, cuando la variable aleatoria X es el producto de un gran número de otras variables aleatorias, la distribución de los logaritmos de X puede aproximarse a la Normal, ya que los logaritmos de X son la suma de los logaritmos de los factores contribuyentes.

Si se tiene una variable aleatoria X y ln X = Y, se ajusta a una distribución Normal, se dice que la variable aleatoria X es log normalmente distribuida.

Función de Distribución de Probabilidad Asumiendo Y = log a (X) f(x) = σ y x 1 2π exp     1 2   y 2 σ 2 y    

Parámetros y Factor de frecuencia

• Media (Parámetro de escala) • Desviación estandar (Parámetro de forma) Estimación de parámetros: Método de los momentos Y  1 N i N   1 log a ( X i ) Y    1 N   i N   1  log a ( X i )  Y  2  1 2 ln   =  y + K  y K es la misma de la distribución normal Si se quiere trabajar con la variable no transformada en el campo logarítmico se tiene que: K = exp    K T  ln  1 + Cv   Cv   ln  1 + 2 Cv 2       1

F u  1   1 T 1   K T = F u 1   1 T 1 r   Es el inverso de la función de distribución Normal estandarizada acumulada y Cv es el coeficiente de variación • Intervalos de confianza  : Nivel de confianza o significancia S T : Error estándar ln   

u

1  2 S T S T =   Y N  =   1 + K 2 2 T   1/2

Ejemplo: Distribución Log Normal

La media y desviación estándar de los Q max del río Nare son: anuales de la estación μ=94.35 m 3 /s y σ=22.45 m 3 /s μ Y =4.52 y σ Y =0.2337

Hallar el Q TR=100 si los Q max tienen una distribución Log Normal.

K=2.326

Q Y Tr=100 =4.52+2.326*0.237

Q Tr=100 =159 m 3 /s Intervalos de Confianza: Ln(Q TR=100 )  μ 95 S T

Es un intervalo de dos colas, con una probabilidad en cada una de 5% S T =   Y N  =   1 + K 2 2 T   1/2 δ=1.92

S T =0.075

4.94  Q Y  5.071

 1.6*0.075

5.14 139  159  170 m 3 /s

Distribución Gamma (2 Parámetros)

Una de las mas usadas en Hidrología.

• • • • • Crecientes máximas anuales Caudales mínimos Volúmenes de flujo anuales y estacionales Valores de precipitaciones extremas Volúmenes de lluvia de corta duración Tiene 2 ó 3 parámetros (Pearson Tipo III).

f(x) = |

1 |

(

)

  

x

    

1 e x -

Parámetros y Factor de frecuencia

• • •    (Parámetro de escala) > 0 (Parámetro de forma) (  ) es la función Gamma completa  (  ) =  0  z  1 e z dz Estimación de parámetros: Método de los momentos  =  = 1 2 v  2 =  2     K  K T + (K t 2  1) 6 + 1 3 ( K T 3  6K T )   ˆ 6    2  (K T 2  1)   ˆ 6    3 + K T   ˆ 6    4  1 3   ˆ 6    5

Distribución Gamma (3 Parámetros)

Función de distribución de probabilidad f(x) 1 = | α | Γ(β) x α x o  β 1 exp x x o α • Función de densidad acumulada

P

(

X

x

)  1   (  ) 0 

X e

  

x

x

0   

x

0 • Parámetros  y  , parámetros de escala y forma respectivamente.

x o parámetro de localización.

 (  ) =  0  z  1 e z dz   1

dx

Parámetros e Intervalos de confianza (Función Gamma

) • Estimación de Parámetros: Método de los momentos = 2 2 =  2 Xˆ 0 =  Que tan cercano puede estar el estimado al verdadero valor desconocido de la población: Conocer con cierta certeza. Franja grande: mucha incertidumbre.

X T  u 1   2 S T  : Nivel de confianza o nivel de probabilidad S T : Error estándar S T =   N

Tabla Factor de frecuencia Pearson tipo III

Valores de



para la Distribución Gamma ó Pearson tipo III

Ejemplo: Distribución Gamma

Hallar el Q TR=100 . Si la distribución de los caudales de la estación de Nare es Gamma.

μ = 94.35 m 3 /s y σ = 22.45 m 3 /s, γ = 0.845

De tabla: μ Y = 4.52 y σ Y = 0.2337,  Y = 0.0069

K = 2.32

Q TR=100 = 94.35 + 2.32*22.45 = 146.4

Intervalos de confianza: X T

u 1

 

2 S T

De tabla δ=4.7, N= 36 datos.

S T

  

N

De tabla  95 =1.6

S T = 17.6

146,4  146.4  1.6*17.6

28.16 m 3 /s

Distribución Log Pearson Tipo III

Función de distribución de probabilidad

f x

(x) = 1 x   (  )   ln (x)  y o    1 e   ln (x)  y o   • Parámetros  y  , parámetros de escala y forma y y o parámetro de localización • Estimación de Parámetros Método de los momentos  2 y   2 = y 2 y yˆ 0  y  ˆ ˆ

Factor de Frecuencia: Y T = ln X T = y + K  y • Intervalos de Confianza: Que tan cercano puede estar el estimado al verdadero valor desconocido de la población: Conocer con cierta certeza. Franja grande: mucha incertidumbre.

X T  u 1  2 S T  : Nivel de confianza o nivel de probabilidad S T : Error estándar S T =   y N

ln X T

 

1

 

/ 2 S T

Distribución General de Valor Extremo

Los valores extremos son valores máximos y mínimos seleccionados de un conjuntos de datos.

Las distribuciones de valores extremos seleccionados de conjuntos de muestras de cualquier distribución de probabilidad convergen en una de las tres formas de distribución de valor extremo , llamadas: • Tipo I: Gumbel, • Tipo II: Frechet • Tipo III: Weibull g=1.14

g<=1.14

g>=1.14

Función de Distribución de probabilidad para la GEV F(x) = exp     1 

x

   1 /    

Donde:  ,  y  son parámetros que deben ser determinados.

Los tres casos limitantes son: 1.

 = 0  Distribución de Valor Extremo Tipo I (Gumbel) f(x) = 1  exp   x   exp x      Rango:   x   Estimación de parámetros:  

x

 0 .

5772  =  6

2.  < 0  Distribución de Valor Extremo Tipo II (Frechet) f(x) = exp     1 

x

   1 /     Rango: (    /  )  x   3.  > 0  Distribución de Valor Extremo Tipo III (Weibull) f(x) = exp    1 

x

    1 /     Rango:    x  (    /  )

Distribución Gumbel

La fda y el factor de frecuencias es: F(x)  exp   exp 

x

       

x

  K =  6  0.577

+ ln  ln T r ln  T r 1    • Intervalos de confianza: Que tan cercano puede estar el estimado al valor verdadero desconocido de la población.

X T  u 1  2 S T  : Nivel de confianza o nivel de probabilidad S T : Error estándar 

S T =

N

 =  1 + 1.1396K

+ 1.1

K

Ejemplo: Distribución Gumbel

Si los caudales de la estación del río Nare tienen una distribución Gumbel:

Q Tr

  95

S T

K 100    6  0 .

577  ln  ln T R K Tr=100 = 3.13

 ln( T R  1 )  

Q Tr

 100   

Q Tr

 100 94 .

35 

K

 3 .

13  22 .

45  164 .

77 Intervalos de confianza:

Ejemplo: Distribución Gumbel

S T =   N  =  1 + 1.1396K

+ 1.1

K δ = 3.91

141.4  Q TR S T  = 14.62

1.6*14.62

164.77  188.17 m 3 /s