Aplicación de redes bayesianas para modelamiento y predicción de calidad del aire en áreas urbana
Acceso a Texto completo
Abstract
La contaminación del aire es hoy en día uno de los mayores problemas en las grandes ciudades. Entender la
dinámica de los contaminantes y determinar la calidad de aire en áreas no monitorizadas ha sido el objetivo
de varias investigaciones recientes dada su relevancia en la creación de políticas de mitigación. Los enfoques
propuestos se dividen principalmente en aquellos que intentan modelar la dinámica de emisión/difusión y en
aquellos que intentan predecir la concentración de contaminantes en el espacio y/o tiempo. Comúnmente
estos enfoques tienen fines diferentes, los primeros se enfocan en entender los mecanismos que expliquen
la distribución histórica de contaminantes, mientras que los segundos se enfocan en crear modelos predictivos,
sin importar si dichos modelos representan las causalidades de los procesos subyacentes. En la presente
investigación se propone la aplicación de modelos de redes Bayesianas, las cuales pueden tanto capturar
posibles causalidades del proceso de formación y difusión de contaminación, así como servir de modelos
algorítmicos para inferir en el espacio y en el tiempo los parámetros de calidad del aire. Se aplicó la técnica
de bootstraping junto con técnicas de aprendizaje estructural para aprender diversos modelos bayesianos e
integrarlos en un modelo robusto en el cual se puede discriminar relaciones fuertes entre las variables de
calidad del aire de posibles relaciones espurias. En un primer experimento se creó modelos para predecir un
determinado tipo de contaminante en un punto en el espacio, dada las mediciones de una red de estaciones del
mismo tipo de contaminante. En un segundo experimento se adicionó varios tipos de contaminantes para hacer
dicha predicción. En un tercer experimento se aprendió modelos adicionando dos variables metereológicas
comúnmente usadas para el modelado de calidad del aire: velocidad y dirección del viento. En un cuarto
experimento se aprendió modelos suministrando conocimiento a priori aprendido en el primer experimento a fin
de reducir costo computacional de aprendizaje e inferencia. En total, se aprendieron 504 modelos, identificándose
6 modelos en el ultimo experimento con capacidades predictivas significativas a costos computacionales
razonables. Como ventaja del modelado se pudo identificar las distancias de influencia de la red de estaciones
que incide directamente en la predicción espacial, ayudando así a entender la dinámica de difusión de los
diferentes tipos de contaminantes.