Informática con mención en Ciencias de la Computación

URI permanente para esta colecciónhttp://54.81.141.168/handle/123456789/51445

Explorar

Resultados de Búsqueda

Mostrando 1 - 6 de 6
  • Ítem
    Support system for decision making in the phenotypic Evaluation of brown swiss cattle using image processing and augmented reality
    (Pontificia Universidad Católica del Perú, 2019-11-27) Apumayta Lopez, Julianna Milagros; Alatrista Salas, Hugo; Nuñez del Prado, Miguel
    To certify the information coming from the registered animals of different breeds and to guarantee their racial purity and contribute to the genetic improvement, we propose the development of a model based on augmented reality and support decision making for identification and automatic classification of Brown Swiss cattle. TensorFlow Object Detection API was used to detect the cow in real time. The learning transfer approach was used for training, and MobilNet pre-trained architecture was selected. MobilNet is an efficient model for mobile applications because it is small in size and fasts. The results were reflected in the development of a mobile app, which was evaluated through the automatic adjustment and calibration of the template on the cow if the animal that was focusing was or was not of the Brown Swiss breed.
  • Ítem
    Identificación de líderes de opinión mediante el modelo PROV-DM y técnicas de minería de grafos
    (Pontificia Universidad Católica del Perú, 2019-09-04) Leon Payano, Mauro Antonio; Alatrista Salas, Hugo
    El análisis de la influencia social nos permite estudiar la manera de determinar la opinión de las personas utilizando como medio el intercambio de información. Dentro de esta disciplina, la identificación líderes de opinión tiene como finalidad identificar a las personas que ejercen un mayor nivel de influencia. La identificación de líderes de opinión se usa en campañas de marketing viral, sistemas de recomendación de productos y en sistemas de detección de anómalas en redes de telefonía móvil. Debido a que los medios sociales se han transformado en la fuente de datos más representativa y relevante para entender el comportamiento de las personas, el análisis de influencia se ha convertido en una de las tecnologías más importantes en las industrias modernas de información y servicios. Existen diversos métodos para identificar a los líderes de opinión. En este trabajo se plantea un algoritmo híbrido para cuantificar la influencia de acuerdo a atributos estáticos y de interacción de los usuarios pertenecientes a una red social. Los algoritmos híbridos requieren la representación de las interacciones de los usuarios mediante grafos. Por ello, se implementó un algoritmo de construcción, de segmentación y de visualización de grafos con el objeto de abordar los desafíos que involucra identificar y cuantificar la influencia de los usuarios en grandes redes sociales. El procedimiento fue aplicado en mensajes que tratan sobre el calentamiento global, recolectados desde la plataforma de Twitter con el objetivo de representar en un grafo, a los usuarios interesados en el tema. Los líderes de opinión seleccionados a partir del algoritmo propuesto representan mejor la influencia ganada a través del proceso de difusión. Este documento consta de 6 Capítulos: El capítulo 1 busca venir el problema y el enfoque adoptado en este trabajo. El Capítulo 2 describe los diversos conceptos, métodos, procesos y herramientas utilizados en el análisis de influencia social tanto en el presente trabajo y estudios relacionados. El Capítulo 3 describe los trabajos previos que busquen identificar líderes de opinión en grandes redes sociales. El Capítulo 4 describe el procedimiento de análisis de influencia social desarrollado. El Capítulo 5 describe los resultados obtenidos en la ejecución del procedimiento propuesto. Finalmente, el Capítulo 6 presentamos las conclusiones y recomendaciones obtenidas producto de trabajo realizado.
  • Ítem
    Predicting market segmentation variables using Twitter following relations
    (Pontificia Universidad Católica del Perú, 2018-12-03) Brossard Núñez, Ian Paul; Alatrista Salas, Hugo
    From the beginning, social sciences have looked to categorize people into groups that share common characteristics, to better serve the population, giving a distinguished treatment to each group. Applying this approach to the planning of business activities, we can better understand people’s needs, choosing the most favorable marketing strategies for each stratum of customers (saving effort in advertising and distribution) and maximize the level of satisfaction of each of market segment. Social Media is not a stranger to this principle: a correct segmentation will allow companies to avoid bringing content to people that are not part of their target audience, and to better respond to comments and complaints about their products and brands. However, some Social Media like Twitter still haven’t included demographic markers about their users within their marketing platforms, rendering decision-making difficult. In this paper, we demonstrate that it is possible to estimate important demographic information in Social Media by analyzing the tastes and preferences of the users (represented through the Twitter accounts they follow). We present four predictive models that allowed us to estimate the gender, age, socio-economic level and LATIR Lifestyle of a Twitter user. These models were trained using machine learning algorithms
  • Ítem
    Diseño de un proceso computacional basado en técnicas de minería de datos para el análisis del fenómeno de "El Niño"
    (Pontificia Universidad Católica del Perú, 2018-01-19) Díaz Barriga, Oscar Antonio; Alatrista Salas, Hugo
    El Perú es afectado recurrentemente por el fenómeno El Niño, el cual es un fenómeno climático que consiste en el aumento de la temperatura del mar en el Pacifico Ecuatorial. Este a su vez forma parte del ENSO (El Niño - Oscilación del Sur) que tiene un periodo de actuación de 2 a 7 años, con una fase cálida conocida como El Niño y una fase fría, La Niña. En la actualidad mediante un juicio experto se analizan las diversas fuentes de datos heterogéneas para poder encontrar posibles correlaciones útiles entre ellos. En el presente trabajo se propone un proceso computacional basado en técnicas de minería de datos que permita determinar la existencia de correlaciones espacio-temporales en relación a la temperatura superficial del mar y las variables meteorológicas pertenecientes a las regiones de la costa norte del Perú, en el periodo 2015 al 2016, último intervalo de tiempo en el que se presentó El Nino. Para esto se utiliza una metodología basada en KDD (Knowledge Discovery in Database), la cual está conformada por una serie de pasos como: la recolección de diferentes fuentes de datos, la integración en una base de datos explotable, limpieza y pretratamiento de los datos, creación de escenarios que permitan validar las posibles correlaciones, extracción de patrones mediante la librería SPMF y finalmente una propuesta de visualización, de los patrones encontrados, que permita comprender mejor el fenómeno. Los resultados obtenidos muestran la existencia de correlaciones espaciotemporales en las regiones del norte del Perú principalmente entre la temperatura de la superficie del mar y el caudal de los ríos de la costa, siendo estas correlaciones validadas por un experto miembro del IGP.
  • Ítem
    Caracterización espacio temporal de la ecofisiología de la "apodanthera biflora" utilizando minería de patrones secuenciales
    (Pontificia Universidad Católica del Perú, 2016-10-28) Barturén Larrea, José Luis; Alatrista Salas, Hugo
    En los últimos años, los investigadores del Laboratorio de Ecología Evolutiva de la Universidad Peruana Cayetano Heredia (UPCH) han venido estudiando especies nativas del Bosque Seco Ecuatorial del norte del Perú. Este es el caso de la Apodanthera Biflora, raíz comestible de potencial uso alimentario e industrial. Con la finalidad de desarrollar planes de sostenibilidad y preservación de la especie, los expertos requieren realizar estudios más extensos sobre los factores que afectan las características nutricionales e industriales de la especie. Para determinar estos factores se deben descubrir correlaciones temporales a partir de fuentes de datos heterogéneas. Debido a la dificultad de explotar este tipo de datos no estandarizados ni agrupados, los métodos estadísticos tradicionales no son suficientes, por lo que se requiere herramientas permitan al experto identificar qué correlaciones temporales representan patrones frecuentes relevantes. El presente trabajo evalúa el uso de las técnicas de minería de patrones secuenciales y visualización espacial, con el objetivo de determinar si su aplicación facilita la obtención de patrones frecuentes relevantes a partir de distintas fuentes de datos heterogéneos relacionados a la Apodanthera Biflora. Para lograr este objetivo, se utiliza una metodología basada en el Descubrimiento de Conocimiento a partir de Bases de Datos (KDD por sus siglas en inglés), el cuál define fases para la selección, pre procesamiento, transformación, minería y evaluación (visualización) de los datos. Los resultados obtenidos demostraron que la técnica de minería de patrones secuenciales PrefixSpan y la visualización espacial, utilizando librerías de Google Maps API y D3 Js, permitieron a los expertos la obtención de patrones frecuentes relevantes. Así mismo, la técnica de transformación GIS para datos geográficos, y la técnica de discretización por entropía y frecuencia, han permitido el pre procesamiento de datos heterogéneos. A partir de las correlaciones descubiertas, los expertos identificaron patrones frecuentes relevantes, en las localidades de Chulucanas, Cerrato, El Morante, P. Mora y El Porvenir; principalmente relacionados a las características del suelo, precipitaciones y composición química de la raíz.
  • Ítem
    Extracción de patrones semánticamente distintos a partir de los datos almacenados en la plataforma Paideia
    (Pontificia Universidad Católica del Perú, 2016-06-25) Flores Lafosse, Natali; Alatrista Salas, Hugo
    En la actualidad el uso de plataformas LMS (Learning Management System) se ha convertido en una necesidad en las instituciones de educación superior. Una de las plataformas más populares es Moodle, la cual se enfoca en el uso de módulos para distribuir el contenido educativo. Sin embargo, los docentes que utilizan la plataforma no suelen recibir una retroalimentación sobre el comportamiento de sus alumnos en sus cursos. Existen muchos métodos para conseguir dicha retroalimentación, encuestas o entrevistas, sin embargo el uso de los logs del sistema presenta la ventaja de almacenar información verídica del comportamiento de los usuarios. La presente tesis busca utilizar algoritmos de Minería de Datos para extraer patrones de comportamiento semánticamente distintos de los usuarios de la plataforma, a fin de brindar retroalimentación tanto a los administradores de la plataforma como a los docentes. Se buscan patrones semánticamente distintos para así hacer un análisis con diferentes acercamientos a la misma búsqueda de información. Para ello se hace uso de la metodología Descubrimiento de Conocimiento a partir de bases de Datos (KDD por sus siglas en inglés), la cual establece una serie de pasos a seguir. Aplicando dicha metodología, en principio, se realizó una selección de los datos a utilizar. A esta selección, luego, se le aplica un pre-procesamiento antes de utilizarla como entrada de los algoritmos de Minería de Datos, usando la librería SPMF y la aplicación Weka según sea el caso. Se usaron distintos algoritmos tanto para clusterizar datos, descubrir itemsets frecuentes y reglas de asociación y obtener patrones secuenciales. Los resultados de clusterización resultaron en tres grupos, caracterizados por las acciones que realizan. Las reglas de asociación e itemsets frecuentes mostraron un comportamiento regular de los usuarios, quienes principalmente ingresan para “ver” tanto “cursos” como “recursos”. Una conclusión similar se deriva la los patrones secuenciales, los cuales repiten la acción de “ver” frecuentemente. Finalmente, los resultados de reglas de asociación se visualizan en un grafo de fuerzas. Parte de los patrones secuenciales se usan para un grafo similar. Estos grafos junto a las figuras de clusterización sirven como resultados de los objetivos. La tesis está dividida en seis capítulos. El primero es la introducción y contexto. Le sigue el capítulo de estado del arte y marco teórico. El capítulo 3 establece los objetivos. El capítulo 4 describe la experimentación y resultados. En el capítulo 5 se analizan y discuten los datos recabados de la experimentación. Finalmente, en el capítulo 6 se presentan las conclusiones, limitaciones del estudio y trabajos futuros.