Informática con mención en Ciencias de la Computación
URI permanente para esta colecciónhttp://54.81.141.168/handle/123456789/51445
Explorar
Ítem Texto completo enlazado Aplicación de redes bayesianas para modelamiento y predicción de calidad del aire en áreas urbana(Pontificia Universidad Católica del Perú, 2020-10-27) Cusi Chirapo, Hernán; Villanueva Talavera, Edwin RafaelLa contaminación del aire es hoy en día uno de los mayores problemas en las grandes ciudades. Entender la dinámica de los contaminantes y determinar la calidad de aire en áreas no monitorizadas ha sido el objetivo de varias investigaciones recientes dada su relevancia en la creación de políticas de mitigación. Los enfoques propuestos se dividen principalmente en aquellos que intentan modelar la dinámica de emisión/difusión y en aquellos que intentan predecir la concentración de contaminantes en el espacio y/o tiempo. Comúnmente estos enfoques tienen fines diferentes, los primeros se enfocan en entender los mecanismos que expliquen la distribución histórica de contaminantes, mientras que los segundos se enfocan en crear modelos predictivos, sin importar si dichos modelos representan las causalidades de los procesos subyacentes. En la presente investigación se propone la aplicación de modelos de redes Bayesianas, las cuales pueden tanto capturar posibles causalidades del proceso de formación y difusión de contaminación, así como servir de modelos algorítmicos para inferir en el espacio y en el tiempo los parámetros de calidad del aire. Se aplicó la técnica de bootstraping junto con técnicas de aprendizaje estructural para aprender diversos modelos bayesianos e integrarlos en un modelo robusto en el cual se puede discriminar relaciones fuertes entre las variables de calidad del aire de posibles relaciones espurias. En un primer experimento se creó modelos para predecir un determinado tipo de contaminante en un punto en el espacio, dada las mediciones de una red de estaciones del mismo tipo de contaminante. En un segundo experimento se adicionó varios tipos de contaminantes para hacer dicha predicción. En un tercer experimento se aprendió modelos adicionando dos variables metereológicas comúnmente usadas para el modelado de calidad del aire: velocidad y dirección del viento. En un cuarto experimento se aprendió modelos suministrando conocimiento a priori aprendido en el primer experimento a fin de reducir costo computacional de aprendizaje e inferencia. En total, se aprendieron 504 modelos, identificándose 6 modelos en el ultimo experimento con capacidades predictivas significativas a costos computacionales razonables. Como ventaja del modelado se pudo identificar las distancias de influencia de la red de estaciones que incide directamente en la predicción espacial, ayudando así a entender la dinámica de difusión de los diferentes tipos de contaminantes.Ítem Texto completo enlazado Implementación de un modelo algorítmico para la estimación del nivel de concentración de contaminante PM2,5 en zonas urbana(Pontificia Universidad Católica del Perú, 2020-10-29) Vargas Campos, Irvin Rosendo; Villanueva Talavera, Edwin RafaelSegún la Organización Mundial de la Salud (OMS), la mala calidad del aire provoca 1 de cada 10 muertes globalmente, 7 millones de personas fallecen al año debido a enfermedades causadas por la contaminación, además la mala calidad del aire es un factor contribuyente al cambio climático, específicamente al calentamiento global. En Perú, se debe cumplir los Estándares de Calidad Ambiental (ECAs) establecidos por el Ministerio del Ambiente y supervisados por el Organismo de Evaluación y Fiscalización Ambiental (OEFA); no obstante, cumplir esta tarea se ve dificultada por la baja cantidad de estaciones de medición. Debido a ello, el presente proyecto propone estudiar diferentes estrategias de ingeniería de características y modelos de aprendizaje de máquina que puedan estimar el nivel de contaminación de aire en zonas urbanas no censadas. Para ello, se usó datos de contaminantes y variables meteorológicas recolectados por una red de monitoreo en la ciudad de Beijing, China. Se obtuvo como resultado que el modelo Linear Regression entrenado con los datasets de contaminante PM2;5 de las 5 estaciones más cercanas al punto de predicción y normalizados mediante una adaptación de Inverse Distance Weighting presentó mejor capacidad de estimación. Por otro lado, los modelos LightGBM y XGBoost presentaron resultados un poco inferiores, pero eran más robustos, pues su capacidad de estimación se mantenía estable a pesar de la modificación de la cantidad de estaciones usadas para el entrenamiento de los modelos. Como trabajo futuro, se pretende usar y adaptar los modelos estudiados en esta investigación en las zonas urbanas de Lima, Perú.