Tesis y Trabajos de Investigación PUCP

URI permanente para esta comunidadhttp://54.81.141.168/handle/123456789/6

El Repositorio Digital de Tesis y Trabajos de Investigación PUCP aporta al Repositorio Institucional con todos sus registros, organizados por grado: Doctorado, Maestría, Licenciatura y Bachillerato. Se actualiza permanentemente con las nuevas tesis y trabajos de investigación sustentados y autorizados, así como también con los que que fueron sustentados años atrás.
Ingresa a su web: Repositorio Digital de Tesis y Trabajos de Investigación PUCP

Explorar

Resultados de búsqueda

Mostrando 1 - 5 de 5
  • Ítem
    Generación de datos sintéticos usando Redes Generativas Adversariales para la minería de datos respetuosa de la privacidad
    (Pontificia Universidad Católica del Perú, 2021-05-28) Montalvo García, Peter Jonathan; Alatrista Salas, Hugo
    La minería de datos permite conocer patrones en grandes volúmenes de datos; pero dentro de estos datos puede haber información sensible que compromete la privacidad. En tal sentido, se han desarrollado técnicas para la minería de datos respetuosa de la privacidad, siendo la más utilizada la privacidad diferencial debido a las propiedades que otorga a los datos resultantes, de la mano de técnicas de aprendizaje profundo. Estas técnicas se han utilizado en conjuntos de datos de números escritos e imágenes, pero no en datos de georreferenciación. El presente trabajo tiene como objetivo medir la eficacia de los datos sintéticos generados a través redes generativas adversariales y privacidad diferencial en datos de georreferenciación. La generación de estos datos se hace a través de selección de datos, sanitización para la obtención de la base de datos sintéticos y evaluación a través de modelos de movilidad a partir de las trazas que sirven para medir la pérdida de información y el riesgo de divulgación. En líneas generales, los resultados demuestran que la aplicación de estas técnicas sobre datos de georreferencia da como producto un conjunto de datos sintéticos con una pérdida de información y riesgo de divulgación bajos, y se concluye que estos conjuntos de datos obtenido se puede realizar una minería de datos similar a la que se haría con los datos originales y sin comprometer información sensible.
  • Ítem
    Recommender systems using temporal restricted sequential patterns
    (Pontificia Universidad Católica del Perú, 2021-04-12) Samamé Jimenez, Hilda Ana; Alatrista Salas, Hugo; Núñez del Prado Cortez, Miguel
    Recommendation systems are algorithms for suggesting relevant items to users. Generally, the recommendations are expressed in what will be recommended and a value representing the recommendation's relevance. However, forecasting if the user will buy the recommended item in the next day, week, or month is crucial for companies. The present study describes a process to suggest items from sequential patterns under temporal restrictions.
  • Ítem
    Diseño de un proceso computacional basado en técnicas de minería de datos para el análisis del fenómeno de "El Niño"
    (Pontificia Universidad Católica del Perú, 2018-01-19) Díaz Barriga, Oscar Antonio; Alatrista Salas, Hugo
    El Perú es afectado recurrentemente por el fenómeno El Niño, el cual es un fenómeno climático que consiste en el aumento de la temperatura del mar en el Pacifico Ecuatorial. Este a su vez forma parte del ENSO (El Niño - Oscilación del Sur) que tiene un periodo de actuación de 2 a 7 años, con una fase cálida conocida como El Niño y una fase fría, La Niña. En la actualidad mediante un juicio experto se analizan las diversas fuentes de datos heterogéneas para poder encontrar posibles correlaciones útiles entre ellos. En el presente trabajo se propone un proceso computacional basado en técnicas de minería de datos que permita determinar la existencia de correlaciones espacio-temporales en relación a la temperatura superficial del mar y las variables meteorológicas pertenecientes a las regiones de la costa norte del Perú, en el periodo 2015 al 2016, último intervalo de tiempo en el que se presentó El Nino. Para esto se utiliza una metodología basada en KDD (Knowledge Discovery in Database), la cual está conformada por una serie de pasos como: la recolección de diferentes fuentes de datos, la integración en una base de datos explotable, limpieza y pretratamiento de los datos, creación de escenarios que permitan validar las posibles correlaciones, extracción de patrones mediante la librería SPMF y finalmente una propuesta de visualización, de los patrones encontrados, que permita comprender mejor el fenómeno. Los resultados obtenidos muestran la existencia de correlaciones espaciotemporales en las regiones del norte del Perú principalmente entre la temperatura de la superficie del mar y el caudal de los ríos de la costa, siendo estas correlaciones validadas por un experto miembro del IGP.
  • Ítem
    Caracterización espacio temporal de la ecofisiología de la "apodanthera biflora" utilizando minería de patrones secuenciales
    (Pontificia Universidad Católica del Perú, 2016-10-28) Barturén Larrea, José Luis; Alatrista Salas, Hugo
    En los últimos años, los investigadores del Laboratorio de Ecología Evolutiva de la Universidad Peruana Cayetano Heredia (UPCH) han venido estudiando especies nativas del Bosque Seco Ecuatorial del norte del Perú. Este es el caso de la Apodanthera Biflora, raíz comestible de potencial uso alimentario e industrial. Con la finalidad de desarrollar planes de sostenibilidad y preservación de la especie, los expertos requieren realizar estudios más extensos sobre los factores que afectan las características nutricionales e industriales de la especie. Para determinar estos factores se deben descubrir correlaciones temporales a partir de fuentes de datos heterogéneas. Debido a la dificultad de explotar este tipo de datos no estandarizados ni agrupados, los métodos estadísticos tradicionales no son suficientes, por lo que se requiere herramientas permitan al experto identificar qué correlaciones temporales representan patrones frecuentes relevantes. El presente trabajo evalúa el uso de las técnicas de minería de patrones secuenciales y visualización espacial, con el objetivo de determinar si su aplicación facilita la obtención de patrones frecuentes relevantes a partir de distintas fuentes de datos heterogéneos relacionados a la Apodanthera Biflora. Para lograr este objetivo, se utiliza una metodología basada en el Descubrimiento de Conocimiento a partir de Bases de Datos (KDD por sus siglas en inglés), el cuál define fases para la selección, pre procesamiento, transformación, minería y evaluación (visualización) de los datos. Los resultados obtenidos demostraron que la técnica de minería de patrones secuenciales PrefixSpan y la visualización espacial, utilizando librerías de Google Maps API y D3 Js, permitieron a los expertos la obtención de patrones frecuentes relevantes. Así mismo, la técnica de transformación GIS para datos geográficos, y la técnica de discretización por entropía y frecuencia, han permitido el pre procesamiento de datos heterogéneos. A partir de las correlaciones descubiertas, los expertos identificaron patrones frecuentes relevantes, en las localidades de Chulucanas, Cerrato, El Morante, P. Mora y El Porvenir; principalmente relacionados a las características del suelo, precipitaciones y composición química de la raíz.
  • Ítem
    Proceso de extracción de patrones secuenciales para la caracterización de fenómenos espacio-temporales
    (Pontificia Universidad Católica del Perú, 2016-05-30) Maldonado Cadenillas, Rodrigo Ricardo; Alatrista Salas, Hugo
    El objetivo de este trabajo de fin de carrera es realizar un proceso de extracción de patrones secuenciales basado en KDD, empleando el algoritmo de minería de patrones secuenciales PrefixSpan para prever el comportamiento de fenómenos representados por eventos que cambian con el tiempo y el espacio. Estos tipos de fenómenos son llamados fenómenos espacio-temporales, los cuales son un conjunto de eventos o hechos perceptibles por el hombre. Además, están compuestos por un componente espacial (la ubicación donde sucede el fenómeno), un componente temporal (el momento o intervalo de tiempo en el que ocurre el fenómeno) y un componente de análisis (el conjunto de características que describen el comportamiento del fenómeno). En el mundo, se pueden observar una gran diversidad de fenómenos espaciotemporales; sin embargo, el presente trabajo de fin de carrera se centra en los fenómenos naturales, tomando como caso de prueba el fenómeno espacio-temporal de la contaminación de los ríos en Reino Unido. Por lo tanto, con el fin de realizar un estudio completo sobre este fenómeno, se utiliza KDD (Knowledge Discovery in Databases) para la extracción del conocimiento a través de la generación de patrones novedosos y útiles dentro de esquemas sistemáticos complejos. Además, se utilizan métodos de Minería de Datos para extraer información útil a partir de grandes conjuntos de datos. Así mismo, se utilizan patrones secuenciales, los cuales son eventos frecuentes que ocurren en el tiempo y que permiten descubrir correlaciones entre eventos y revelar relaciones de “antes” y “después”. En resumen, el presente trabajo de fin de carrera se trata de un proceso para mejorar el estudio del comportamiento de los fenómenos gracias al uso de patrones secuenciales. De esta manera, se brinda una alternativa adicional para mejorar el entendimiento de los fenómenos espacio-temporales; y a su vez, el conocimiento previo de sus factores causantes y consecuentes que se puedan desencadenar, lo cual permitiría lanzar alertas tempranas ante posibles acontecimientos atípicos.