Implementación de un modelo algorítmico para la estimación del nivel de concentración de contaminante PM2,5 en zonas urbana
Acceso a Texto completo
Abstract
Según la Organización Mundial de la Salud (OMS), la mala calidad del aire provoca
1 de cada 10 muertes globalmente, 7 millones de personas fallecen al año debido
a enfermedades causadas por la contaminación, además la mala calidad del aire es un
factor contribuyente al cambio climático, específicamente al calentamiento global. En
Perú, se debe cumplir los Estándares de Calidad Ambiental (ECAs) establecidos por
el Ministerio del Ambiente y supervisados por el Organismo de Evaluación y Fiscalización Ambiental (OEFA); no obstante, cumplir esta tarea se ve dificultada por la
baja cantidad de estaciones de medición. Debido a ello, el presente proyecto propone
estudiar diferentes estrategias de ingeniería de características y modelos de aprendizaje de máquina que puedan estimar el nivel de contaminación de aire en zonas urbanas no censadas. Para ello, se usó datos de contaminantes y variables meteorológicas recolectados por una red de monitoreo en la ciudad de Beijing, China. Se obtuvo como resultado que el modelo Linear Regression entrenado con los datasets de contaminante PM2;5 de las 5 estaciones más cercanas al punto de predicción y normalizados mediante una adaptación de Inverse Distance Weighting presentó mejor capacidad de estimación. Por otro lado, los modelos LightGBM y XGBoost presentaron resultados un poco inferiores, pero eran más robustos, pues su capacidad de estimación se mantenía estable a pesar de la modificación de la cantidad de estaciones usadas para el entrenamiento de los modelos. Como trabajo futuro, se pretende usar y adaptar los modelos estudiados en esta investigación en las zonas urbanas de Lima, Perú.