redes neuronales Prediccion de PM10

Download Report

Transcript redes neuronales Prediccion de PM10

Aplicaciones de redes
neuronales
Predicción de PM-10
Lucila L. Chiarvetto Peralta
¿Qué es PM-10?
o Es material sólido ó líquido suspendido en la
atmósfera
o Emitido ó formado directamente en el aire
o Es material caracterizado por fracciones de tamaño
gruesas ó finas
oMP- 10 incluye particulas de 10 micrómetros en
diámetro ó más pequeñas
oMP- 2.5 incluye particulas de 2.5 micrómetros en
diámetro ó más pequeñas
Lucila L. Chiarvetto Peralta
Comparación
Lucila L. Chiarvetto Peralta
Definición del predictor
Se quiere predecir los promedios
diarios de PM10 medidos en
microgramos por metro cúbico, en
función a los datos
meteorológicos, para la ubicación
actual de la EMCABB.
Lucila L. Chiarvetto Peralta
EMCABB
Lucila L. Chiarvetto Peralta
¿Por qué se quiere construir este
predictor?


Se identificó como requerimiento.
El observatorio ambiental debe ser
capaz de generar alarmas cuando
se pronostique que un cierto
contaminante supere el valor de
referencia de la norma que lo
regula.
Lucila L. Chiarvetto Peralta
Justificaciones
Las redes neuronales imitan el
proceso de aprendizaje del cerebro
y pueden procesar problemas que
impliquen datos muy complejos con
relaciones no lineales, incluso
cuando los datos son imprecisos y
“ruidosos”. En particular cuando
la relación entre los datos es
desconocida.
Lucila L. Chiarvetto Peralta
Otras aplicaciones


Herramienta de estudio,
permitiendo conocimiento sobre el
fenómeno, en cuestión.
Herramienta de modelado
alternativa.
Lucila L. Chiarvetto Peralta
Diseño arquitectónico
Estación
meteorológica
PECAS
Usuario
davies
Modulo
predictor
Lucila L. Chiarvetto Peralta
Red neuronal, herramienta





JOONE, Java Object Oriented Neural
Engine
Joone (http://www.joone.org/) es un
framework realizado en JAVA, para la
construcción y desarrollo de aplicaciones
basadas en redes neuronales.
Las aplicaciones de Joone pueden ser
construidas en una maquina local.
Pueden ser entrenadas en un ambiente
distribuido.
Licencia: GNU LESSER GENERAL PUBLIC
LICENSE de la Free Software Foundation.
Lucila L. Chiarvetto Peralta
Joone utilizado en el mundo académico




Using JavaTM Technology – Based
neural networks to predict trauma
mortality
Layered learning in RoboCup Rescue
simulation
Modelling and verification of digital
circuit using neural network
Neural network and evolutionary
algorithms.
Lucila L. Chiarvetto Peralta
Ejemplo
y  4 x
2
Lucila L. Chiarvetto Peralta
Screen shoots
Lucila L. Chiarvetto Peralta
Panel de control
Lucila L. Chiarvetto Peralta
Ejemplo, entrenamiento
valor observado
10,00
5,00
0,00
-5,00 1
-10,00
-15,00
-20,00
-25,00
-30,00
-35,00
4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55 58 61
valor observado
Lucila L. Chiarvetto Peralta
Métodos de evaluación




RMSE, root mean square error
MSE, mean square error
MAE, mean absolute error
D, indice de acuerdo
Lucila L. Chiarvetto Peralta
MSE
N
Formula: MSE 
2
(
P

O
)
 i i
i 1
N
donde :
O i  dat o observadoi
Pi  dat o predichoi
N  cant idadde ejemplosut ilizadospara el
ent renamient o
Lucila L. Chiarvetto Peralta
RMSE
N
Formula: RMSE  MSE 
2
(
P

O
)
 i i
i 1
N
donde :
O i  dat o observadoi
Pi  dat o predichoi
N  cant idadde ejemplosut ilizadospara el
ent renamient o
Lucila L. Chiarvetto Peralta
MAE
N
Formula: MAE 

i 1
Pi  Oi
N
donde :
O i  dat o observadoi
Pi  dat o predichoi
N  cant idadde ejemplosut ilizadospara el
ent renamient o
Lucila L. Chiarvetto Peralta
d
N
Formula: d  1 
2
(
P

O
)
 i i
i 1
N
2
(
P

O

O

O
)
 i
i
i 1
donde :
O  promediode los datosobservados
O i  dato observadoi
Pi  dato predichoi
N  cantidadde ejemplosutilizadospara el entrenamiento
Lucila L. Chiarvetto Peralta
d



El valor d varia entre 0 y 1.
El valor d=1, significa una
coincidencia perfecta entre los
valores predichos y los observados.
El valor d=0, significa un completo
desacuerdo entre los valores
predichos y los valores observados.
Lucila L. Chiarvetto Peralta
d

No tiene dimensión.

Estándar de comparación.
Lucila L. Chiarvetto Peralta
Entrenamiento, validación, evaluación
Se selecciona del conjunto total de
observaciones:
 70% para entrenamiento
 15% para validación
 15% para evaluación
Lucila L. Chiarvetto Peralta
Ejemplo, error
Lucila L. Chiarvetto Peralta
Ejemplo, entrenamiento
Entrenamiento
10,00
5,00
0,00
-5,00 1 5 9 13 17 21 25 29 33 37 41 45 49 53 57 61
-10,00
valor observado
-15,00
valor predicho
-20,00
-25,00
-30,00
-35,00
Lucila L. Chiarvetto Peralta
Ejemplo, estado luego del
entrenamiento

Epoch: 7000

RMSE: 0.4461003990923533

d: 0.9991660
Lucila L. Chiarvetto Peralta
Ejemplo, validación
Validación
10
5
0
-5 1 5 9 13 17 21 25 29 33 37 41 45 49 53 57
-10
-15
Calculado, según
función
Valor predicho,
validación
-20
-25
-30
-35
Lucila L. Chiarvetto Peralta
Ejemplo, evaluación
Evaluación
10
5
0
-5 1 5 9 13 17 21 25 29 33 37 41 45 49 53 57
-10
-15
Calculado, según
función
Valor predicho,
evaluación
-20
-25
-30
-35
Lucila L. Chiarvetto Peralta
Consideraciones de diseño más
importantes




Selección de una arquitectura
optima (cantidad de elementos de
la capa oculta).
Selección de la mejor función de
activación.
Selección de los ejemplos de
entrenamiento, testing y
evaluación.
Selección de cantidad de epochs.
Lucila L. Chiarvetto Peralta
Ejemplo otra arquitectura
Lucila L. Chiarvetto Peralta
Selección de la arquitectura
Lucila L. Chiarvetto Peralta
Selección de arquitectura
Lucila L. Chiarvetto Peralta
Selección de la mejor función de
activación


Tangente hiperbólica:
RMSE=7.73276
Logaritmo: RMSE= 6.60171
Lucila L. Chiarvetto Peralta
Error, logaritmo
Lucila L. Chiarvetto Peralta
Selección de los ejemplos
La selección de los ejemplos de
entrenamiento, debe ser capaz de
mostrar toda la complejidad del
problema. Sin dar información en exceso,
ni en defecto.
La tarea de selección es
particularmente difícil, dado que la
relación entre los datos que se desea
modelar, es usualmente,
desconocida.
Lucila L. Chiarvetto Peralta
Selección de la cantidad de epochs


Falta de entrenar la red, produce
que la red quede atrapada en un
mínimo local.
Sobre entrenamiento, produce una
falta de capacidad en filtrar el ruido.
Es como si aprendiera de
“memoria”.
Lucila L. Chiarvetto Peralta
Sobreentrenamiento
Lucila L. Chiarvetto Peralta
Conclusiones
Es una técnica que ya ha sido
utilizada en la predicción de calidad
de aire, que ha mostrado ser
efectiva para la predicción de
polución en aire. Esto hace posible
la generación de alarma, cuando se
supere la norma de referencia.
Lucila L. Chiarvetto Peralta
Conclusiones
Permite el estudio, cuantificación y
comparación, de la contribución
meteorológica en las variaciones de
concentraciones del material
particulado.
Lucila L. Chiarvetto Peralta
Conclusiones
Predicción de calidad de aire: Si bien, los
modelos a base de redes neuronales han
mostraron mejores resultados que los
modelos de regresión y deterministas. Se
observaron dos corrientes de
pensamientos diferente en la comunidad
científica:
 Adoptan el modelo.
 Adoptan el modelo de forma temporaria,
mientras se desarrollan modelos
deterministas.
Lucila L. Chiarvetto Peralta
Bibliografía y referencias






Air quality prediction in Milan: feed-forward neural
networks, pruned neural networks and lazy learning.
Giorgio Corani
Artificial neural network approach for modelling
nitrogen dioxide dispersion from vehicular exhaust
emissions.
S.M. Shiva Nagendra, Mukesh Khare.
Assessment and prediction of tropospheric ozone
concentration levels. Usign artificial neural networks.
S.A. Abdul-Wahab, S.M. Al-Alawi
Willmott, C.J., 1982. Some comments on the
evaluation of model performance. Bull. Am. Meteorol.
Soc. 63, 1309–1313
www.epa.gov
www.jooneworld.org
Lucila L. Chiarvetto Peralta