"ANÁLISIS DE VALORES EXTREMOS". Rafael Santiago Seoane.

Download Report

Transcript "ANÁLISIS DE VALORES EXTREMOS". Rafael Santiago Seoane.

1 Taller sobre Estudios Hidrológicos en
Areas Serranas de la Provincia de
Córdoba
Teoría de Valores Extremos
Rafael Santiago Seoane
Instituto Nacional del Agua
FIUBA, CONICET
Córdoba Octubre 2011
• Conceptos clásicos
• Nuevos temas de estudio
Aplicaciones e importancia
de la teoría
 Estimación de caudales máximos y mínimos y su
frecuencia de ocurrencia.
 Definir la relación caudal-periodo de retorno.
 Estimación de una función de densidad de
probabilidades.
 Numerosas obras hidráulicas se diseñan con
esta metodología.
 Algunos países trataron de definir este problema
con una legislación,
Nuevos temas
 Procesos No estacionarios. Los procesos hidrológicos
pueden presentar características que cambian con el
tiempo. En el contexto hidrológico se definen: a) ocurren
en ciertas épocas del año y b) asociados con la
presencia de tendencias relacionadas a cambios
climáticos de largo plazo (long term period).
 Algunos orígenes de la No estacionariedad. Se
asocian con cambios en el uso del suelo en la cuenca,
presencia de nuevas obras (por ejemplo: embalses) y
modificaciones en las propiedades de la precipitación.
Modelos y temas
 Principales modelos de valores extremos:
Gumbel, Log-Normal II y III, Pearson III, LogPearson III.
 Problemas clásicos: selección del modelo y
estimación de sus parámetros.
 Principales hipótesis de la teoría clásica.
 Modelos en un contexto no estacionario.
 Detección de tendencias en máximos y mínimos.
 Modelos de función de densidad derivada de
caudales extremos.
Evolución de los temas
 Selección de
modelos.
 Estimación de
parámetros y
verificación del
modelo.
 Máxima
verosimilitudes
irregulares.
 No estacionariedad.
 Detección de
tendencias.
 Modelo Generalizado
de Valores Extremos.
 Máxima verosimilitud.
 Ecuaciones con la
variación temporal de
los parámetros.
Temas a considerar
 Existen numerosos métodos de estimación de
los parámetros del modelo.
 Orígenes
de la incertidumbre de las
estimaciones con los modelos de valores
extremos.
 Presentación de algunos criterios de selección
del modelo.
Proceso de selección y estimación
de un modelo
 Seleccionar una función de densidad de
probabilidades para representar una serie de
caudales máximos o mínimos(*).
 Estimar los parámetros de la función de densidad
de probabilidades
 Estimar
los caudales máximos o mínimos
asociados con distintos períodos de retorno.
 (*) importancia de la autocorrelación entre los datos.
Métodos de estimación
 Los parámetros desconocidos del modelo son
inferidos a partir de datos históricos .
 Existen numerosas técnicas para la estimación
de los parámetros pero todas tienen ventajas y
desventajas.
 Los
métodos
de
estimación
no
son
independientes del problema de la selección del
modelo.
 La estimación de parámetros en modelos
asimétricos es más complicada debido a la
presencia de verosimilitudes irregulares.
Histograma Río Paraná
Función GEV en Posadas
Fuentes de incertidumbre
 Incertidumbre en los parámetros: corresponde
a la asociada con la estimación de los
parámetros del proceso utilizando una
cantidad limitada de datos.
 Incertidumbre en el modelo: corresponde a la
asociada con la idea de que el modelo
probabilístico
asumido
del
proceso
estocástico sea el correcto.
Cuantificación de la incertidumbre
 Los análisis estadísticos definen estimaciones a
partir de datos históricos. Diferentes muestras
igualmente representativas pueden definir otras
y distintas estimaciones.
 En el análisis de valores extremos resulta muy
importante la cuantificación de la incertidumbre
debido a que cambios pequeños en los
parámetros pueden influir en las extrapolaciones
de la variable.
Algunos conceptos sobre el modelo
 Paradigma de valores extremos que implica: la
independencia y la estacionaridad.
 Existe una hipótesis implícita que consiste en
suponer que el mecanismo estocástico
subyacente del proceso es suave para permitir la
extrapolación de los valores de la muestra.
Procesos aleatorios
 Un proceso aleatorio es una secuencia de
variables aleatorias X1, X2, X3--- Xn. El ejemplo
más simple consiste en
las variables
independientes e idénticamente distribuidas.
 Estacionario:
un proceso aleatorio es
estacionario si dado un conjunto de variables
(i1,i2,i3…in) si para cualquier entero m son
idénticas las distribuciones conjuntas de (Xi,1,…,
Xi,k) y (Xi,1+m,…, Xi,k+m).
Modelos matemáticos
Son expresiones matemáticas que representan las principales
características de los procesos.
Algunos ejemplo son los modelos (PIC):
Probabilísticos: Gumbel y GEV.
Probabilísticos-Dererminísticos: FDD.
Algunas hipótesis básicas
• Independencia
temporal
entre
las
observaciones.
• Las observaciones tienen las mismas
propiedades estadísticas (Existe una única
función de densidad de probabilidades).
Presencia de autocorrelación
(Caudales mínimos)
Funciones de densidad de
probabilidades en Hidrología
Gumbel
Generalizada de Valores Extremos
Pearson III
Log-Pearson III
Log-Normal II y III
Modelos de valores extremos
Función de densidad o
distribución
Modelo
 1  ln( x )    
1
 
f ( x) 
exp   

x 2 
 
 2
2
Log-Normal II
x
x
x
Pearson III
f ( x )    ( x   ) 
 1
exp   ( x   ) 
 ( )
x
Log-Pearson III
f x ( x )    (ln( x )   ) 
 1
f ( x) 
GEV


F ( x )  exp  


x
x  ( )
 x
 x
exp  
 exp  





Gumbel
x
exp   (ln( x )   ) 
1
 (x  

1



1
)











Métodos de estimación
de parámetros
 Momentos
 Máxima Verosimilitud
 Máxima Verosimilitud Corregido
Problema clave: la cantidad de combinaciones
posibles entre distintos modelos y métodos de
estimación.
Máxima verosimilitud
Es un método flexible y general de
estimación de los parámetros desconocidos
θ0 de un modelo dentro de una familia F de
modelos.
Siendo
x1,x2,x3,,,,,xn
las
ocurrencias
independientes de una variable aleatoria con
una unción de densidad de probabilidades
f(x; θ0).
Función de verosimilitud
n
L ( )  
i 1
f ( xi ,  )
n
l ( )  log L ( )   log f ( x i ,  )
i 1
Modelo de valores extremos /EV1-Gumbel)
 Valores extremos: máximos o mínimos.
 Caudal máximo o caudal mínimo.
 Precipitaciones máximas.
 Siendo el número de valores observado es grande la
distribución converge a alguna de las tres formas
denominadas I, II y III.
24
Modelo de Gumbel
Moda α,
Media α+γβ (where γ=0.5772156649... is Euler's constant),
and
Varianza ⅙β2π2
Modelo Gumbel y Máxima Verosimilitud
f ( x ,  ,  )   exp   ( x   )  exp   ( x   ) 

LogL  N log   N  x   exp   ( x   ) 
N
i 1
Modelo Gumbel
Distribution of annual maximum streamflow follows an EV1 distribution
27
Ecuaciones de MV del Modelo
Pearson III
 Ecuaciones no lineales
log L   n log  (  ) 
 log L

 log L


 n
 log L


1


n
 ( x   )  (   1)  log( x   )  n  ln 

i
i 1
 (x   ) 
i 1
 (  )'
( )
2
n
n
2
n
1
i
i 1
n

0
n
  log( x   )  n ln   0
i
i 1
n
1
i 1
(x   )
 (   1) 
i
 0
i
Función de Verosimilitud
Río Blackstone
Modelo Pearson III
Diferencias según el modelo
Río Blackstone (USA) (MV)
Modelo
100
1000
5000
10000
Gumbel
430
578
681
726
Log-N II
747
1297
1795
2041
Log-N III
577
941
1261
1432
P III
560
802
974
1050
LP III
877
2520
5311
7343
Nota: Caudales en m3/s, Período de retorno en años.
Criterios de selección entre modelos
 El Criterio de Información Bayesiano (BIC)
contribuye a
resolver el problema de la
selección entre varios modelos alternativos.
 El Criterio de Información de Akaike (AIC)
permite analizar la bondad del ajuste e incluye
una penalización por el número de parámetros
estimados para el modelo.
Criterios de selección entre
modelos (AIC y BIC)
 Akaike Information Criterio (AIC, 1974)
AIC  2 k  2 ln( L )
k: número de parámetros y L: verosimilitud.
 Bayesian Information Criterio (BIC, 1978)
BIC  k ln( n )  2 ln( L )
n: cantidad de datos.
Diferencias por método de
estimación y un período de retorno10000 años
Modelo
Blackstone
LogNormal II
(M o MV)
Log-Normal Log-Normal
III (M)
III MV
72117
80978
50082
Feather
660182
413930
983531
Limay (PL)
10483
7762
15366
Manawatu
8094
7207
8237
Type of project
Return period (years)
Examples
Urban drainage (low
risk, up to 1 km2)
5 to 10
Small city
Urban drainage (mediun
risk, more than to
1 km2)
25 to 50
Medium city
Urban drainage (high
risk, more than to
10 km2)
50 to 100
Large city
(Buenos Aires,
Rosario)
Principal spillways
(dams)
20 to 100
Corpus y Yacireta
Emergency spillways
(dams)
100 to 10000
Corpus y Yacireta
Bridges
100 to 500
Tancredo Neves
Y Túnel subfluvial
Prueba no paramétrica
de Mann - Kendall
La prueba tiene como objetivo detectar una tendencia al
incremento o al decrecimiento en los datos más que la
ocurrencia de un evento aislado.
 H0) los datos son una muestra de n variables aleatorias
independientes e idénticamente distribuidas.
 H1) la distribución de xj y xk no son idénticas para todos k, j
< n con k  j.
(xj y xk son variables aleatorias independientes e idénticamente
distribuidas)
Los estadísticos que intervienen en el análisis son S y Z,
que se asocian con el estimador de pendiente B en el
signo:
n 1
n
S    sgn(x
k 1j  k  1



Z



S 1
j
 xk )
 1 si θ  0

sgn (θ ) =  0 si θ  0
 - 1 si θ < 0

si S  0
Var(S)
0
S 1
Var(S)
si S  0
si S  0
B = Mediana
x  x
 j
k

j-k




 k


< j
Prueba de Verosimilitud
  m
  l
  l
 
  2    L  1 ,  1, x i     L ( 2 ,  2 , x j )     L ( 0 ,  0 , x k )  
  i  n
  j  n 1
 
  k n
donde:
L  1 ,  1, x i 
L ( 2 ,  2 , x j )
: log-verosimilitud estimada con las observaciones de la
primer parte de la serie para el modelo seleccionado;
: log-verosimilitud estimada con las observaciones de la
segunda parte de la serie para el modelo seleccionado;
: log-verosimilitud estimada con las observaciones de la
serie completa para el modelo seleccionado.
L ( 0 ,  0 , x k )
La estimación del estadístico de la prueba
implica ajustar una función de densidad de
probabilidades a la serie completa de las
observaciones y a las dos series parciales
correspondientes a la primera y segunda parte
de la serie temporal.
 Ho: las observaciones pueden ser
representadas por un único modelo.
 H1: las observaciones no pueden ser
representadas por un único modelo.
1904-1982 vs
1983-2002
1904-1981 vs
1982-2002
1904-1980 vs
1981-2002
1904-1979 vs
1980-2002
1904-1978 vs
1979-2002
1904-1977 vs
1978-2002
1904-1976 vs
1977-2002
GUMBEL
1904-1975 vs
1976-2002
1904-1974 vs
1975-2002
1904-1973 vs
1974-2002
1904-1972 vs
1973-2002
1904-1971 vs
1972-2002
1904-1970 vs
1971-2002
1904-1969 vs
1970-2002
18
1904-1968 vs
1969-2002
1904-1967 vs
1968-2002
1904-1966 vs
1967-2002
Coeficiente Prueba de Verosimilitud
Prueba de Verosimilitud
PARANA - CORRIENTES
Series de Caudales Máximos Anuales - Prueba de Verosimilitud
16
GEV
14
12
10
8
6
4
2
0
Pruebas para detección del
punto de cambio
CUSUM
Prueba de Pettitt
Análisis de tendencias
Sm (Cusum)
00-01
96-97
92-93
88-89
Sm
-130000
84-85
0.0
80-81
-110000
76-77
0.1
72-73
-90000
68-69
0.2
64-65
-70000
60-61
0.3
56-57
-50000
52-53
0.4
48-49
-30000
44-45
0.5
40-41
-10000
36-37
0.6
32-33
10000
28-29
0.7
24-25
30000
20-21
0.8
16-17
50000
12-13
0.9
08-09
70000
04-05
Probabilidad
Probabilidad de Punto de Cambio - PETTITT
1.0
Caudales máximos ( Corrientes)
AJUSTE MÁXIMOS RIO PARANÁ - Estación Corrientes
GEV - MMV
80000
70000
60000
3
Q (m /s)
50000
40000
30000
20000
Serie Completa
1976-77 a 2002-03
1904-05 a 1975-76
10000
0
1
10
100
Tr (año)
1000
No estacionario
Gumbel:
M0 = modelo
estacionario
M1 =Tendencia
lineal
M2 = SOI influence
M3 = Tendencia lineal +
SOI
Log-likelihood Gumbel:
Estimación de parámetros
Resultados para Modelos
No Estacionarios
Inferencia para distintos
períodos de retorno
Modelo GEV
z  GEV (  (t ),  , )
t
t  
 t
0
1
     t   t2
t
0
1
2
     SOI (t )
t
0
1
Expresiones de Verosimilitud
z   t
z   t
m
t
t
0
1
0
1
1
l (  , , )     log   (1 
) log 1   (

1


(



t 1
























1

1
z     SOI (t )
z     SOI (t ) 
m
t
t
0
1
0
1
1
l (  , , )     log   (1 
) log 1   (

1


(



t 1


























Problemas asociados para considerar
Alguna distribuciones utilizadas en Hidrología
presentan tres parámetros y el método de
máxima verosimilitud podría producir problemas
de estimación.
Las
pruebas
usadas
(Chi-cuadrado
y
Kolmogorov-Smirnov) fueron diseñadas para
discriminar modelos en la región de los medios.
Los valores estimados de los caudales
asociados con un período de retorno dado
difieren según el modelo y el método de
estimación de parámetros.
Modelos de función de
densidad derivada de
caudales extremos
El procedimiento para la evaluación de una distribución de
frecuencias de caudales máximos para cuencas con datos
escasos tiene las siguientes etapas:
1.-Definir la función de densidad de probabilidades
conjunta de intensidad y duración de la precipitación.
2.-Seleccionar el modelo de infiltración.
3.-Obtener la función de densidad de probabilidades
conjunta del exceso de precipitación.
4.-Definir el proceso de escurrimiento directo.
5.-Definir la función de distribución acumulada del caudal
directo máximo.
6.-Modelar el flujo base.
7.-Estimar los caudales máximos asociados a distintas
probabilidades de excedencia.
Esquema de la función de densidad
derivada de caudales (Eagleson, 1972)
Modelo de
precipitación
f(ie,te)
Obtención de la
distribución de Qmáx
FQmáx(Qmáx)
Qmáx = g(ie,te)
Parámetros climáticos
Modelo de respuesta
P-Q
Parámetros de la cuenca
Nueva función de densidad de probabilidades derivada de
caudales máximos que incluye el HUI de Nash como
modelo de respuesta de la cuenca.
Para estimar la probabilidad de excedencia del caudal
máximo es necesario determinar la función de distribución
acumulada de Qmáx que está dada por:
FQmáx ( Q máx )   f Ie ,Te ( i e , t e ) di e dt e
R
Región del plano ie, te donde la convolución de fie,te
con el modelo de respuesta de la cuenca produce
caudales máximos menores o iguales a Qmáx
Función de densidad de probabilidades conjunta
de la intensidad y duración efectivas de la
precipitación
La función de densidad de probabilidades conjunta de la
intensidad y duración efectivas está dada en dos partes,
(Raines y Valdés, 1993):
Probi e  0 , t e  0  1  exp(  ) (   1) 
*

f Ie ,Te ( i e , t e )  0.77642  exp( t e   )  (   1) S

exp  1.39047 S
*
0.44161
 0.44161
0.55839
te
ie
0.44161
0.44161
te
0.44161
ie

: inversa del valor medio de la duración [1/L],
: inversa del valor medio de la intensidad puntual [T/L],
*
 0.2 S 
  




12
*
 

K
K  1  exp  1.1
 0.25
  exp  1.1
 0.25
A: Area de la cuenca
S 
25400
CN
 254
CN: Número de curva
 0.003861A 
Aplicando la aproximación de Díaz Granados et al. (1984)
para obtener la función de distribución acumulada de
Qmáx, se llega a:
FQmáx ( Q máx )  1   exp(  ) (   1) 

G   exp  t e  1.39047 S
T
*
0.44161
*

*
H i   exp   t e  1.39047 S

aiT *

bi T
*
Q máx 
T
*

* 0.55839
 0.44161
Q máx
*
0.44161
T


*

te
c Q
i
*
máx
te

di
G
 H i 
 dt



e
0.55839 d i
te
 0.44161

 dt
 e

Q máx
i
ai
bi
ci
di
A
1
0.0000
0.1024
0.5000
1.0000
2
0.1024
0.2890
0.6529
1.1081
3
0.2890
0.5722
0.8048
1.3640
4
0.5722
1.0000
1.0000
3.1358
2k( n )
( n  1)
n 1
exp( 1  n )
Aplicación de la metodología en dos cuencas del
centro de la provincia de Buenos Aires
Parámetros del modelo de precipitación
Estación: Aeropuerto de Olavarría. Servicio Meteorológico Nacional.
Período: 1988 – 1997.
Precipitación media anual: 900 mm.
Separación de eventos independientes: Córdova y Bras (1981).
Parámetros
Serie
Escala
temporal
 (h/cm)
 (1/h)
Olavarría
horaria
1.014
0.255
Comparación de las funciones de distribución
acumuladas
Cuenca arroyo Tapalqué
Probabilidad de no excedencia
1.0
0.9
0.8
Nuevo modelo (mediana momentos)
Nuevo modelo (Rosso v=0.18 m/s)
0.7
Raines y Valdés
Empírica F(x) = 1- m/(n+1)
0.6
100
150
200
250
300
3
Caudal (m /s)
350
400
450
Cuenca arroyo Azul
Probabilidad de no excedencia
1.0
0.9
0.8
Nuevo modelo (mediana momentos)
Nuevo modelo (Rosso v=0.08 m/s)
0.7
Raines y Valdés
Empírica F(x) = 1- m/(n+1)
0.6
100
150
200
250
300
3
Caudal (m /s)
350
400
450
Distancias de Kolmogorov -Smirnov
Método de
estimación
Modelo
Qmáx > 50 m3/s
Qmáx > 250 m3/s
0.212
0.063
Media momentos
0.269
0.027
Mediana momentos
0.264
0.025
Rosso v=0.18 m/s
0.261
0.023
Rosso v=0.50 m/s
0.200
0.051
Rosso v=1.07 m/s
0.155
0.082
Raines y Valdés
Nuevo modelo
n
 j
D n  máx 
j 1
 n
 F x X
j
Dn
 

Dn: distancia de Kolmogorov-Smirnov,
Xj: caudal máximo observado,
Fx(Xj): función de distribución acumulada de Qmáx,
j : número de orden,
n: tamaño de la muestra.
Conclusiones
 La idea de un programa de investigación sobre
máximos, muy importante durante la mayor parte
del siglo XX implica incluir algunos nuevos temas.
 La hipótesis de no estacionariedad ha pasado a
ser considerada importante de la modelación de
valores extremos.
 La relación caudal-periodo de retorno depende
de la autocorrelación (mínimos).
 El modelo de función derivada muestra la
importancia de incluir las características de la
cuenca y del clima en la representación de los
extremos .
Bibliografía
 Bras,R., 1990. Hydrology. An Introduction to
Hydrologic Science. Addison Wisley, 1990.
 Maidment,D.,1992. Handbook of Hydrology. Mc
Graw-Hill.
 Ven Te Chow, 1962. Handbook of Applied
Hydrology.
 Ven Te Chow, Maidment,D y L. Mays. 1994.
Hidrología Aplicada. Mc Graw-Hill.
Bibliografía
 Tapley T. D. y P. R. Waylen, 1990. Spatial variability
of annual precipitation and ENSO events in Western
Peru. Hydrol. Sci. J.35(4), 429-446.
 World Meteorological Organization, 1989. Statistical
distributions for flood frequency analysis. World
Meterol. Organization, WMO-Nº 718, OH Rep. Nº 33.
Valores estimados del AIC y BIC
Modelo
Número de
parámetros
Pearson III
3
AIC
BIC
671.80
676.71
Gumbel
2
674.38
677.66
LogNormal II
LogNormal III
GEV
3
674.13
679.05
3
674.72
679.64
3
675.66
680.58
Modelo Gumbel
Bondad de ajuste
Prueba de
Kolmogorov-Smirnov :
Función GEV Corrientes
Density Plot for GEV Distribution for CORRIENTES
25
20
15
10
5
0
20000
30000
40000
CORRIENTES
50000
60000
Función de verosimilitud GEV
Función GEV
Estimates of GEV parameters
estimate "s.e."
Mu
25923 832.5
Sigma
5334 610.7
Eta
0.05845 0.09646
Maximum Log-Likelihood = -1039.633
Análisis del ajuste Q-Q Plot
• Type of projects (several return period)
•Selection of projects at Paraná river
•Non stationary processes (flood analysis and
Gumbel models)
•Precipitation analysis and largest cities at
Paraná basin
Return Period
 Random variable:
X
 Threshold level:
xT
 Extreme event occurs if:X  x T
 Recurrence interval:
 Return Period:
  Time between ocurrences
of X  x T
E ( )
Average recurrence interval between events
equaling or exceeding a threshold
 If p is the probability of occurrence of an
1
extreme event,
E ( )  Tthen

p
or
P ( X  xT ) 
1
T
72
Hydrologic extremes
 Extreme events
 Floods
 Droughts
 Magnitude of extreme events is related to their
frequency of occurrence
1
M agnitude 
F requency of occurence
 The objective of frequency analysis is to relate the
magnitude of events to their frequency of occurrence
through probability distribution
 It is assumed the events (data) are independent and
come from identical distribution
73
Flood
•High stage in river when the river overflows and
inundates the adjoining area
•Flood peak and frequency of the peak is an important
consideration in hydraulic design
•Magnitude and time of the flood varies with change in
watershed characteristics
•Peak flood depends on rainfall, discharge and
watershed area and type
Flood
•Magnitude of flood can be estimated by
•Rational method
•Empirical method
•Unit hydrograph technique
•Flood frequency studies
Análisis de extremos y ENSO
La modelación como población mezcla (Tapley y
Waylen, 1990) que expresa que cuando una
variable aleatoria, x, resulta de una gran
cantidad de posibles procesos generados, su
distribución de probabilidad, Fx, puede asumirse
como la suma de m distribuciones de cada uno
de los procesos generados Fk, donde k = 1, ...,
m, ponderándolos de acuerdo a su frecuencia
de ocurrencia, gk,
Análisis de extremos y ENSO
 Modelo de población mixta
m
F (x  X )   g F (x  X )
x
k 1
k
k
1


k1
F x ( x  X )  g 1 exp  1 
( x  1 )
1


k2
1


k2
 g 2 exp  1 
( x   2 )
2


k2
Modelación de extremos ENSO
Ajuste Población Mezcla
Caudal Max .Inst. (m3/s)
1000
100
10
-2
-1
0
1
2
3
4
Variable reducida Gumbel
No Niño
Niño
GVE Mezcla
GEV
5
6
Series de extremos
Series de extremos
Río Blackstone
Río Feather
Diferencias por la presencia de
Autocorrelación
C u r v a s Q m i n - P e r ío d o d e r e to r n o
R ío B e r m e jo - E s ta c ió n P o z o S a r m ie n to
34
33
M E TOD OL OGIA C LA S IC A
32
C ORRE C C ION P OR A UTOC ORRE LA C ION
31
r 1 =0.3 6 6
30
29
Q (m 3 /se g )
28
27
26
25
24
23
22
21
20
19
18
0
10
20
30
40
50
60
Tr (Añ o s )
70
80
90
1 00
110
Type of project
Return period (years)
Examples
Urban drainage (low
risk, up to 1 km2)
5 to 10
Small city
Urban drainage (mediun
risk, more than to
1 km2)
25 to 50
Medium city
Urban drainage (high
risk, more than to
10 km2)
50 to 100
Large city
(Buenos Aires,
Rosario)
Principal spillways
(dams)
20 to 100
Corpus y Yacireta
Emergency spillways
(dams)
100 to 10000
Corpus y Yacireta
Bridges
100 to 500
Tancredo Neves
Y Túnel subfluvial
•"
Selection of project
•"
Name
River
Dam
Yacyreta
Paraná
Dam
Corpus
Paraná
Bridge
Tancredo Neves
Paraná
Bridge
Rosario-Victoria
Paraná
Bridge
Tunel Subfluvial
Paraná
Bridge
Zarate Brazo Largo
Paraná
Empirical Formula
Characteristics of Empirical Formulae are :
 Regional formula
 Based on correlation
 Between flow(Qp) and catchment properties
 Almost all the formula represent discharge as a
function of Area
 Neglects flood frequency
 The reason why empirical formulas are all
regional and gives approximate results when
applied to other regions
Climate Risk
Dresden, river Elbe
Runoff 5 0 0 0
(m 3 s – 1 ) 4 0 0 0
3000
2000
1000
0
1850
1900
1950
2000
PD F
 mean and variability
and extremes
2%
0
2000
risk
4000
R u n o f f (m 3 s – 1 )
Gardenier & Gardenier (1988) In: Encyclopedia of statistical sciences 8:141, Wiley
Mudelsee (2006) DKKV/ARL Workshop
Climate Change
Dresden, river Elbe
Runoff 5 0 0 0
(m 3 s – 1 ) 4 0 0 0
3000
2000
1000
0
1850
1900
1950
2000
PD F
PD F
5%
2%
 climate risk change?
0
2000
4000
R u n o f f (m 3 s – 1 )
0
2000
4000
R u n o f f (m 3 s – 1 )
Solomon et al. (Eds.) (2007) Climate Change 2007: The Physical Science Basis.
Cambridge Univ. Press
Hydrologic extremes
 Extreme events
 Floods
 Droughts
 Magnitude of extreme events is related to their
frequency of occurrence
M agnitude 
1
F requency of occurence
 The objective of frequency analysis is to relate
the magnitude of events to their frequency of
occurrence through probability distribution
 It is assumed the events (data) are independent
and come from identical distribution
87
Return Period
 Random variable:
X
 Threshold level:
xT
 Extreme event occurs if:X
 Recurrence interval:  Time
 xT
between ocurrences
of X  x T
 Return Period: E ( )
Average recurrence interval between events
equaling or exceeding a threshold
 If p is the probability of occurrence of an
1
extreme event,
E ( )  Tthen

p
or
P ( X  xT ) 
1
T
88
More on return period
 If p is probability of success, then (1-p) is the
probability of failure
 Find probability that (X ≥ xT) at least once in N
years.
p  P ( X  xT )
P ( X  x T )  (1  p )
P ( X  x T at least once in N years )  1  P ( X  x T all N years )
P ( X  x T at least once in N years )  1  (1  p )
N
1

 1  1  
T 

N
89
Frequency Factors
 Previous example only works if distribution is
invertible, many are not.
 Once a distribution has been selected and its
parameters estimated, then how do we use it?
 Chow proposed using:
 where
x T  Estimated
xT  x  K T s
event magnitude
K T  Frequency
factor
fX(x)
x
KT s
T  Return period
P ( X  xT ) 
x  Sample mean
s  Sample standard
deviation
xT
x
90
1
T
Return period example
 Dataset – annual maximum discharge for 106 years
on Colorado River near Austin
xT = 200,000 cfs
No. of occurrences = 3
500
2 recurrence intervals
in 106 years
A n n u al M ax F lo w ( 10
3
cf s)
600
400
300
T = 106/2 = 53 years
200
100
If xT = 100, 000 cfs
0
1905
1908
1918
1927
1938
1948
1958
1968
1978
Ye ar
1988
1998
7 recurrence intervals
T = 106/7 = 15.2 yrs
P( X ≥ 100,000 cfs at least once in the next 5 years) = 1- (1-1/15.2)5 = 0.29
91
Data series
500
A n n u al M ax F lo w ( 10
3
cf s)
600
400
300
200
100
0
1905
1908
1918
1927
1938
1948
1958
1968
1978
1988
1998
Ye ar
Considering annual maximum series, T for 200,000 cfs = 53 years.
The annual maximum flow for 1935 is 481 cfs. The annual maximum data series
probably excluded some flows that are greater than 200 cfs and less than 481 cfs
Will the T change if we consider monthly maximum
series or weekly maximum series?
92
Hydrologic data
series
• Complete duration series
– All the data available
• Partial duration series
– Magnitude greater than base value
• Annual exceedance series
– Partial duration series with # of
values = # years
• Extreme value series
– Includes largest or smallest values
in equal intervals
•
•
•
Annual series: interval = 1 year
Annual maximum series: largest
values
Annual minimum series : smallest
values
93
Clima y estimación de valores
extremos