Tesis y Trabajos de Investigación PUCP

URI permanente para esta comunidadhttp://54.81.141.168/handle/123456789/6

El Repositorio Digital de Tesis y Trabajos de Investigación PUCP aporta al Repositorio Institucional con todos sus registros, organizados por grado: Doctorado, Maestría, Licenciatura y Bachillerato. Se actualiza permanentemente con las nuevas tesis y trabajos de investigación sustentados y autorizados, así como también con los que que fueron sustentados años atrás.
Ingresa a su web: Repositorio Digital de Tesis y Trabajos de Investigación PUCP

Explorar

Resultados de búsqueda

Mostrando 1 - 10 de 10
  • Ítem
    Estimación del carbono almacenado en paisajes agropecuarios y ganaderos a partir de Imágenes multiespectrales capturadas por drones, y técnicas de aprendizaje profundo
    (Pontificia Universidad Católica del Perú, 2024-01-10) Tovar Galarreta, Juan Carlos Alfredo; Villanueva Talavera, Edwin Rafael
    Los paisajes agrícolas y ganaderos están estrechamente relacionados con el flujo de carbono, ya que actúan como reservorios de carbono en forma de biomasa. La evaluación de las reservas de carbono almacenadas en estas zonas es importante para apoyar la toma de decisiones que impidan que estas zonas se conviertan en fuentes de emisión de carbono. Sin embargo, las técnicas tradicionales de estimación de las reservas de carbono requieren un muestreo in situ, lo que supone una tarea extenuante, arriesgada, costosa DE escasa cobertura. En este estudio, proponemos una metodología, basada en imágenes multiespectrales capturadas por drones y modelos de aprendizaje profundo, para automatizar la tarea de estimar mapas de reservas de carbono almacenados en paisajes agrícolas y ganaderos. Aplicamos una arquitectura de red neuronal U-Net para discriminar las zonas arbóreas y pastizales. Luego, se desarrolla un modelo basado en redes neuronales convolucionales para la estimación de la densidad de carbono a partir de imágenes multiespectrales. Resultados experimentales en paisajes agrícolas y ganaderos de la Amazonía peruana mostraron la efectividad de la metodología propuesta, reportando un mIoU de 87%, un RMSE de 2.44 para zonas arbóreas, y un RMSE de 1.84 para zonas de pastura. Concluimos que la estimación de la densidad de carbono es alcanzable con el enfoque propuesto. Esta metodología puede ser útil para la toma de decisiones y puede contribuir a la gestión o al control del cambio climático.
  • Ítem
    Análisis de clustering de secuencias genómicas de SARS-COV-2 identificadas en Perú
    (Pontificia Universidad Católica del Perú, 2023-11-02) Mejia Mujica, Carolina Estefania; Villanueva Talavera, Edwin Rafael
    El presente proyecto de tesis tiene como objetivo el desarrollo de una herramienta analítica interactiva para representar visualmente la diversidad de las secuencias genómicas de SARS-CoV-2 en el Perú, que facilite el análisis de agrupamientos en el espacio y tiempo; y, que permita incorporar nuevas secuencias. Este trabajo pretende resolver la necesidad de realizar una analítica avanzada que incluya representaciones de agrupamiento en el espacio y tiempo de la diversidad de las secuencias genómicas de SARS-CoV-2 en el Perú con el fin de apoyar la vigilancia genómica. Esta investigación surge debido a la pandemia y al virus que evoluciona aceleradamente presentando constantes variantes genómicas, por lo que, la comunidad académica y autoridades sanitarias están interesados en entender la diversidad de estas para así realizar más estudios sobre su propagación. En el caso del Perú, de acuerdo a la revisión bibliográfica, no se encontraron estudios publicados que investiguen la distribución de las variantes del virus SARS-CoV-2. Comprender esta dinámica es importante porque ayudará a conocer el impacto de la pandemia en el país, además de tener un mejor conocimiento de la propagación del virus SARS-CoV-2 para que las autoridades sanitarias tomen acciones informadas. Por ello, los objetivos planteados son el desarrollo de un módulo de software que permita realizar una representación visual espacio-temporal de las secuencias genómicas SARS-CoV- 2; el desarrollo de un módulo de software que permita realizar un análisis de agrupamiento de las secuencias genómicas SARS-CoV-2 con la capacidad de incorporar nuevas secuencias; y la implementación de vistas con capacidades interactivas en ambos módulos para que el usuario interactúe con ellos. Finalmente, la herramienta desarrollada cumple con realizar un análisis de agrupamiento y una representación visual en el espacio-tiempo de la diversidad de secuencias genómicas SARS-CoV-2 para apoyar la vigilancia genómica en el Perú.
  • Ítem
    Pronóstico del precio de cobre utilizando técnicas de aprendizaje profundo
    (Pontificia Universidad Católica del Perú, 2023-03-06) Carhuas Ñañez, Milton Cesar; Villanueva Talavera, Edwin Rafael
    Pronosticar los precios futuros de cobre es una tarea desafiante dadas las características dinámicas y no lineales de varios factores que afectan el precio del cobre. Este artículo describe modelos de pronóstico, basados en arquitecturas de redes neuronales, para predecir los retornos del precio de cobre en tres horizontes de tiempo: un día, una semana y un mes adelante. Diversas variables se consideran como variables de entrada, como los precios históricos de diferentes materias primas metálicas y variables macroeconómicas globales. Evaluamos los modelos con datos diarios de 2007 a 2020. Los resultados experimentales mostraron que los modelos de salida única presentan un mejor rendimiento predictivo que los modelos de salida múltiple. Las arquitecturas de mejor rendimiento fueron los modelos de memorias largas a corto plazo (LSTM) en datos de prueba.
  • Ítem
    Desarrollo de un pipeline bioinformático que permite el ensamblaje y la anotación del genoma de la bacteria rickettsia asembonensis
    (Pontificia Universidad Católica del Perú, 2022-04-19) Arauco Alarcon, Ronie Paolo; Villanueva Talavera, Edwin Rafael
    En las últimas décadas, el surgimiento y resurgimiento de las bacterias infecciosas se han convertido en amenazas de importancia para la salud pública. Este es el caso de la bacteria de la especie Rickettsia asembonensis -identificada en Asembo, Kenia- que, en los últimos años, ha sido detectada en pulgas (Ctenocephalides felis y Ctenocephalides canis), en regiones anteriormente no reportadas y en casos de síndromes febriles agudos inespecíficos. Este patógeno emergente -así como muchos otros- sigue siendo relativamente desconocido. Por lo que, se convierte en una necesidad sustancial no subestimarlo y expandir su estudio no solo epidemiológico, sino también relacionado a su biología molecular. En la actualidad, el esfuerzo científico a fin de incrementar la eficiencia de la obtención de la biología molecular de las especies a nivel global ha generado la aparición de tecnologías de secuenciación de última generación. En ese sentido, la gran cantidad de datos genómicos deben ser manipulados con técnicas bioinformáticas. Estas últimas, han permitido un mejor entendimiento y uso de los datos que generan las tecnologías de secuenciación. Siendo que, recientemente, la aplicación de protocolos y pipelines ha generado resultados favorables. En consecuencia, la aplicación de técnicas bioinformáticas con la finalidad de obtener la información genómica de la bacteria R. asembonensis representa una oportunidad para contribuir al conocimiento científico de este microorganismo. Por lo tanto, el presente trabajo tiene como objetivo principal el ensamblaje y la anotación del genoma de la bacteria R. asembonensis a través de un pipeline bioinformático, que hará uso de datos secuenciados de la pulga de la especie C. felis positivas para R. asembonensis, a partir de unas muestras recolectadas en un estudio llevado a cabo en la ciudad de Iquitos. El presente trabajo generará también un precedente y referente metodológico para otras especies de interés con la misma problemática.
  • Ítem
    Sobre la construcción de ensambles de clasificadores diversos en tanto que variación normalizada de información y su vínculo con su precisión
    (Pontificia Universidad Católica del Perú, 2021-11-07) Guinea Ordóñez, Rodrigo José; Villanueva Talavera, Edwin Rafael
    La hipótesis en cuestión afirma que, dado el contexto teórico (i.e., definiciones matemáticas consideradas apropiadas para describir los fenómenos que se pretende estudiar) descrito en el artículo, existe una relación entre diversidad global y precisión de un ensamble de clasificadores. Por lo tanto, el propósito de esta investigación es estudiar la relación entre la precisión de ensambles y su diversidad dentro de un contexto geométrico y de información. Para lograrlo, interpretamos el problema como uno geométrico introduciendo un espacio métrico, donde los puntos son predicciones de clasificadores; la función de distancia, la métrica Variación de Información Normalizada (NVI, por sus siglas en inglés); y la construcción de un ensamble diverso es reducida a un problema de criba y novedosamente transformado a uno de programación cuadrática. La significancia estadística es asegurada haciendo uso de métodos Monte Carlo sobre 53 conjuntos de datos apropiados. El resultado es un algoritmo basado en una métrica usada en el contexto de teoría de la información, ideal para estudiar conjuntos de datos de alta dimensionalidad e inherentemente ruidosos. Por tanto, es relevante cuando el costo de adquirir muestras es muy alto; y la cantidad de variables, enorme. El marco teórico incluye las definiciones (e.g., definiciones relacionadas al concepto de diversidad o al espacio métrico utilizado), los teoremas (e.g., propiedades de espacios métricos) y algoritmos base (i.e., programación cuadrática) usados para conseguir los resultados. Los resultados muestran que, en promedio, el exceso de precisión de un ensemble diverso respecto de su contraparte aleatoria es función del valor de la diversidad global del mismo. Esto confirma la hipótesis inicial. Además, la metodología introducida para modelar el algoritmo introduce un marco que permite esclarecer la relación entre diversidad y precisión, ya que la representa en términos geométricos.
  • Ítem
    Aplicación de aprendizaje profundo para la detección y clasificación automática de insectos agrícolas en trampas pegantes
    (Pontificia Universidad Católica del Perú, 2021-09-30) Córdova Pérez, Claudia Sofía; Villanueva Talavera, Edwin Rafael
    La horticultura es una actividad que da trabajo a muchos peruanos en distintas zonas del país, sin embargo, gran parte de la producción de hortalizas es dañada por la alta incidencia de plagas de insectos. En la actualidad, un método efectivo para realizar el control de estas plagas es el uso de trampas pegantes, las cuales atraen y atrapan distintos tipos de insectos. Convencionalmente, las trampas pegantes son colocadas de forma que queden distanciadas uniformemente en el campo donde se realiza el cultivo y luego de varios días se realizan observaciones visuales por parte del personal entrenado en reconocimiento de insectos. No obstante, la información recopilada manualmente por el humano puede no ser tan exacta, pues existen diversos factores que pueden influir en la precisión de esta, por ejemplo, la habilidad de cada persona para detectar distintos tipos de insectos y la posible fatiga que puede ser consecuencia de haber realizado un trabajo manual por mucho tiempo y para una muestra grande de insectos. Las soluciones que se encontraron en la revisión sistemática para tratar problemas de detección de insectos fueron algoritmos de segmentación con cambio de espacio de color, lo cual permite remover el fondo de una imagen y centrarse únicamente en el objeto de interés; también, se encontraron estudios que usaron modelos de detección, los cuales hacen uso de aprendizaje profundo con redes neuronales convolucionales para lograr la identificación de los insectos. Esta última técnica ha dado resultados óptimos en distintos problemas visión computacional, por lo que el presente proyecto de investigación propone usar los modelos de detección pre-entrenados Faster R-CNN y YOLOv4 y aplicarles aprendizaje por transferencia para ajustarlos al problema de detección de tres tipos de plagas de insectos: la mosca blanca, la mosca minadora y el pulgón verde del melocotonero en etapa de adulto alado. Para ello, se debe contar con un corpus de imágenes de trampas pegantes con insectos plaga y, debido a la limitada disponibilidad de estas, se planteó construir un generador de imágenes realistas de trampas pegantes con insectos, el cual tiene en consideración factores realistas como la iluminación y el nivel de ruido en las imágenes, además, se usaron técnicas de segmentación y aumento de imágenes de modo que el corpus obtenido sea el adecuado para la fase de entrenamiento. Finalmente, se midió la métrica mAP de ambos modelos para los tres tipos de insectos. El modelo Faster R-CNN obtuvo 94.06% y el modelo YOLOv4, 95.82%, donde se concluye que el desempeño de ambos detectores es aceptable.
  • Ítem
    Predicción temporal de calidad del aire en Lima a partir de datos de estaciones de bajo costo y Aprendizaje Automático: una revisión de literatura
    (Pontificia Universidad Católica del Perú, 2021-08-23) Paredes Salazar, Diego José; Villanueva Talavera, Edwin Rafael
    El presente trabajo explora los estudios en los cuales se utilizan técnicas de aprendizaje profundo para realizar predicción temporal de calidad del aire, de manera que se pueda comprender que características tendrían los modelos de aprendizaje profundo que tienen un mejor rendimiento con para realizar esta tarea y puedan utilizarse como línea base para desarrollar modelos similares en el contexto de la ciudad de lima. Esta revisión de literatura se realiza con el objetivo de poder obtener los modelos de aprendizaje profundo que estén teniendo un mejor rendimiento en la actualidad al predecir temporalmente la calidad del aire mediante un procedimiento que garantice objetividad y reproducción de resultados. Para ello, se realiza una revisión sistemática de literatura que garantiza el uso de procedimientos estructurados y definidos para conocer las preguntas de investigación que guían la exploración de los estudios de predicción temporal de calidad del aire, los motores de búsqueda considerados para la revisión y las cadenas de búsqueda asociadas tanto a las preguntas de investigación como los motores de búsqueda, de manera que estas se puedan ejecutar y reproducir la obtención de estudios. Las respuestas se reportan en un formulario de extracción con datos relacionados a las arquitecturas de aprendizaje profundo, limitaciones de los modelos empleados y el rendimiento obtenido por cada modelo en cada estudio. Al finalizar el estudio, se concluye que se puede desarrollar un modelo basado en una arquitectura adecuada de aprendizaje profundo para poder atacar el problema de la predicción inadecuada de calidad del aire en Lima al percatar su efectividad reportada en la literatura para otras localidades en el mundo, considerando que dichos modelos deben tomarse únicamente como una línea base y que deben ajustarse a la localidad de Lima para obtener predicciones adecuadas a su entorno.
  • Ítem
    Aplicación de aprendizaje profundo para la detección y clasificación automática de insectos agrícolas en trampas pegantes: una revisión de literatura
    (Pontificia Universidad Católica del Perú, 2021-02-02) Córdova Pérez, Claudia Sofía; Villanueva Talavera, Edwin Rafael
    El presente trabajo de investigación busca hacer una revisión sistemática sobre las técnicas actuales que se usan para solucionar problemas de identificación y clasificación de plagas de insectos, los cuales pueden ser para detectar uno o más tipos de insectos. Dentro de esta revisión, se encontró soluciones como algoritmos de segmentación con cambio de espacio de color, lo cual permite remover el fondo de una imagen y centrarse únicamente en el objeto de interés; también, el uso de modelos de detección, por ejemplo YOLO y Faster R-CNN, los cuales están conformados por redes neuronales convolucionales para lograr la identificación de insectos plaga; además, se encontraron soluciones que hacían uso de SLIC (Simple Linear Iterative Clustering), así como el uso de un análisis multifractal. Un aspecto relevante a tomar en cuenta para saber qué tan eficientes están siendo estas soluciones son las métricas de evaluación con sus respectivos valores obtenidos; sin embargo, estos resultados solo pueden ser comparables si se usa el mismo dataset para entrenamiento y validación. Por consiguiente y dado que la mayoría de estudios recopilados usa un conjunto de datos propio, los resultados mostrados nos sirven para tener una idea de la eficacia de sus soluciones, mas no para comparar los valores de las métricas de evaluación de los distintos aproximamientos tomados en cada estudio revisado. Finalmente, el único insecto plaga que afecta los campos de hortalizas en el Perú y fue encontrado dentro de los estudios fue la mosca blanca. Los demás estudios abordan el problema de detección con otros tipos de insectos, los cuales no son relevantes para el problema de plagas en Perú, sin embargo, sus soluciones son consideradas pues el cambio que se tendría que hacer es en el conjunto de datos que alimenta a las soluciones presentadas en los estudios encontrados.
  • Ítem
    Implementación de un modelo algorítmico para la estimación del nivel de concentración de contaminante PM2,5 en zonas urbana
    (Pontificia Universidad Católica del Perú, 2020-10-29) Vargas Campos, Irvin Rosendo; Villanueva Talavera, Edwin Rafael
    Según la Organización Mundial de la Salud (OMS), la mala calidad del aire provoca 1 de cada 10 muertes globalmente, 7 millones de personas fallecen al año debido a enfermedades causadas por la contaminación, además la mala calidad del aire es un factor contribuyente al cambio climático, específicamente al calentamiento global. En Perú, se debe cumplir los Estándares de Calidad Ambiental (ECAs) establecidos por el Ministerio del Ambiente y supervisados por el Organismo de Evaluación y Fiscalización Ambiental (OEFA); no obstante, cumplir esta tarea se ve dificultada por la baja cantidad de estaciones de medición. Debido a ello, el presente proyecto propone estudiar diferentes estrategias de ingeniería de características y modelos de aprendizaje de máquina que puedan estimar el nivel de contaminación de aire en zonas urbanas no censadas. Para ello, se usó datos de contaminantes y variables meteorológicas recolectados por una red de monitoreo en la ciudad de Beijing, China. Se obtuvo como resultado que el modelo Linear Regression entrenado con los datasets de contaminante PM2;5 de las 5 estaciones más cercanas al punto de predicción y normalizados mediante una adaptación de Inverse Distance Weighting presentó mejor capacidad de estimación. Por otro lado, los modelos LightGBM y XGBoost presentaron resultados un poco inferiores, pero eran más robustos, pues su capacidad de estimación se mantenía estable a pesar de la modificación de la cantidad de estaciones usadas para el entrenamiento de los modelos. Como trabajo futuro, se pretende usar y adaptar los modelos estudiados en esta investigación en las zonas urbanas de Lima, Perú.
  • Ítem
    Aplicación de redes bayesianas para modelamiento y predicción de calidad del aire en áreas urbana
    (Pontificia Universidad Católica del Perú, 2020-10-27) Cusi Chirapo, Hernán; Villanueva Talavera, Edwin Rafael
    La contaminación del aire es hoy en día uno de los mayores problemas en las grandes ciudades. Entender la dinámica de los contaminantes y determinar la calidad de aire en áreas no monitorizadas ha sido el objetivo de varias investigaciones recientes dada su relevancia en la creación de políticas de mitigación. Los enfoques propuestos se dividen principalmente en aquellos que intentan modelar la dinámica de emisión/difusión y en aquellos que intentan predecir la concentración de contaminantes en el espacio y/o tiempo. Comúnmente estos enfoques tienen fines diferentes, los primeros se enfocan en entender los mecanismos que expliquen la distribución histórica de contaminantes, mientras que los segundos se enfocan en crear modelos predictivos, sin importar si dichos modelos representan las causalidades de los procesos subyacentes. En la presente investigación se propone la aplicación de modelos de redes Bayesianas, las cuales pueden tanto capturar posibles causalidades del proceso de formación y difusión de contaminación, así como servir de modelos algorítmicos para inferir en el espacio y en el tiempo los parámetros de calidad del aire. Se aplicó la técnica de bootstraping junto con técnicas de aprendizaje estructural para aprender diversos modelos bayesianos e integrarlos en un modelo robusto en el cual se puede discriminar relaciones fuertes entre las variables de calidad del aire de posibles relaciones espurias. En un primer experimento se creó modelos para predecir un determinado tipo de contaminante en un punto en el espacio, dada las mediciones de una red de estaciones del mismo tipo de contaminante. En un segundo experimento se adicionó varios tipos de contaminantes para hacer dicha predicción. En un tercer experimento se aprendió modelos adicionando dos variables metereológicas comúnmente usadas para el modelado de calidad del aire: velocidad y dirección del viento. En un cuarto experimento se aprendió modelos suministrando conocimiento a priori aprendido en el primer experimento a fin de reducir costo computacional de aprendizaje e inferencia. En total, se aprendieron 504 modelos, identificándose 6 modelos en el ultimo experimento con capacidades predictivas significativas a costos computacionales razonables. Como ventaja del modelado se pudo identificar las distancias de influencia de la red de estaciones que incide directamente en la predicción espacial, ayudando así a entender la dinámica de difusión de los diferentes tipos de contaminantes.