Ingeniería Informática

Permanent URI for this collectionhttp://54.81.141.168/handle/123456789/9139

Browse

Search Results

Now showing 1 - 10 of 19
  • Item
    Diseño de un modelo algorítmico para la discriminación de patrones acústicos entre voces y pisadas humanas
    (Pontificia Universidad Católica del Perú, 2019-03-29) Viera Barthelmes, Cecilia del Pilar; Beltrán Castañón, César Armando
    Actualmente existe una gran demanda de soluciones innovadoras e informáticas que permitan generar sistemas de vigilancia o que ayuden en esta labor. Es así como se han generado diversos proyectos que buscan satisfacer las necesidades de sistemas de este tipo. Mayormente, se ha utilizado la tecnología de imágenes y utilizando drones o algún tipo de cámara, donde una persona está monitoreando estas imágenes captadas en tiempo real para verificar la presencia de un objeto o un ser no deseado. Sin embargo, estas soluciones han presentado una gran complejidad tanto en procesamiento como infraestructura, conllevando así también a un precio elevado de su implantación. Es por esto que este proyecto de investigación se enfoca en presentar una solución a este problema utilizando recursos más simples, basándose en un reconocimiento de patrones en señales acústicas. Esta es un área de la especialidad de informática que en los últimos años ha tenido un gran desarrollo y estudio debido a las diversas aplicaciones que puede tener en el mundo contemporáneo. Cada vez se han ido perfeccionando los algoritmos de extracción de características y de aprendizaje de máquina, por lo cual en este trabajo se utilizarán y compararán dos métodos de caracterización estudiados en investigaciones de reconocimiento de voz. Además, se desarrollará un módulo de recorte de la señal que permita identificar a las regiones de interés. Finalmente, se usarán redes neuronales como el clasificador del algoritmo.
  • Item
    Desarrollo de un framework para la recuperación de imágenes a partir del ingreso de dibujos a mano alzada
    (Pontificia Universidad Católica del Perú, 2018-07-10) Puenternan Fernández, Willy; Beltrán Castañón, César Armando
    En la actualidad las personas demandan constantemente información que les ayude a realizar todo tipo de acciones. Ante esta necesidad surgieron los buscadores web y durante un tiempo permitieron la obtención de información de forma óptima. No obstante, ante la creciente generación de contenido multimedia como imágenes y videos, estos buscadores vieron afectados en gran medida sus funcionalidades al ser incapaces de describir a través de palabras el contenido de objetos abstractos presentes en dichas imágenes. Como alternativas de solución surgen los sistemas de recuperación de imágenes por contenido, cuyo uso se extiende inclusive a la realización de búsquedas más complejas como la recuperación de información en videos. Estos sistemas de recuperación de información visual comprenden dos conocidas áreas: similitud de imágenes y dibujos a mano alzada. En el caso de la búsqueda por similitud de imágenes se permite una mayor aproximación a las imágenes que el usuario desea obtener como resultado de su búsqueda, pero implica que el usuario disponga de una imagen previa de la que desea buscar; por lo que no tiene mucho sentido buscar una imagen si ya se cuenta con otra. Por otro lado, el uso de dibujos hechos a mano es un medio innato de representación del conocimiento utilizado desde tiempos antiguos y que las personas emplean desde edad temprana. Entonces, ¿por qué no utilizar los dibujos a mano alzada como un parámetro de entrada del motor de búsqueda de imágenes? Es lógico pensar que, mediante el uso de trazos, muchos de los problemas presentes en los buscadores tradicionales serían resueltos. No obstante, el desarrollo de esta alternativa de solución trae consigo nuevas e interesantes dificultades a enfrentar. En el presente proyecto de fin de carrera se desarrollará un framework de recuperación de imágenes mediante la especificación de dibujos a mano alzada como parámetro de entrada. Para ello se creará un algoritmo que priorice la obtención de resultados eficaces a partir del uso de técnicas de inteligencia artificial, visión computacional y sistemas de indexación de imágenes. El presente documento se encuentra dividido en 7 capítulos, los cuales abarcan lo siguiente: el primer capítulo presenta el contexto sobre el cual actúa el proyecto de tesis, sus objetivos, los resultados y las herramientas utilizadas para la obtención de estos; el segundo capítulo define los conceptos básicos y técnicos necesarios para un mayor entendimiento durante el desarrollo del framework; el tercer capítulo presenta una muestra de los trabajos más importantes aplicados hasta la fecha en el campo de recuperación de imágenes; el cuarto capítulo describe en detalle cómo se ideó la representación de las imágenes según la metodología de bolsa de características; el quinto capítulo hace hincapié en el diseño e implementación del proceso de comparación y recuperación de imágenes a partir del ingreso de trazos a mano alzada por parte del usuario; el sexto capítulo realiza un análisis de los resultados obtenidos y la validación de estos; finalmente, el séptimo capítulo presenta las conclusiones y recomendaciones obtenidas a lo largo del proyecto de tesis.
  • Item
    Diseño de un modelo algorítmico basado en visión computacional para la detección y clasificación de retinopatía diabética en imágenes retinográficas digitales
    (Pontificia Universidad Católica del Perú, 2018-06-19) Abarca Cusimayta, Daekef Rosendo; Beltrán Castañón, César Armando
    La retinopatía diabética es una enfermedad muy común en pacientes con diabetes. Esta enfermedad ocasiona ceguera de manera gradual debido al deterioro de la retina. Este deterioro puede desencadenar en hemorragias, aneurismas y presencia de exudados en la superficie, las cuales se manifiestan en puntos vacíos de la visión del afectado. Las características mencionadas tienen muchas propiedades visuales como el color, forma, área de presencia que son posibles detectar por medio de imágenes retinográficas digitales. Esta propiedad hace posible el uso de la visión computacional para procesar la imagen y poder diagnosticar la enfermedad de acuerdo al grado de avance de ésta según las características clínicas presentes. El presente proyecto de tesis consiste en el desarrollo de un modelo algorítmico que logre aprovechar las características visuales para poder detectar y clasificar la enfermedad. Las características clínicas utilizadas son los microaneurismas, exudados y hemorragias. Se utilizó una base de datos pública de imágenes retinográficas y un clasificador SVM. El vector de características que se utilizó fue: área, color, número de características prensentes. Es importante mencionar que se utilizó pre-procesamiento en la imagen para excluir elementos como el fondo, disco óptico y las venas debido a que no aportan significativamente al análisis de la imagen. Para el desarrollo del algoritmo se utilizó C++ con OpenCV, la cual es una librería open source para el procesamiento de imágenes. Como resultado final de este proyecto se logró una sensibilidad del 90.17%; especificidad del 96.72% y precisión del 95.08%.
  • Item
    Desarrollo de un modelo algorítmico basado en árboles de decisión para la predicción de la permanencia de un paciente en un proceso psicoterapéutico
    (Pontificia Universidad Católica del Perú, 2018-04-11) Leon Atiquipa, Heli Eliaquin; Beltrán Castañón, César Armando
    En la actualidad existe una creciente necesidad de atención psicológica en nuestro país, por lo que existen muchas instituciones públicas y privadas que ofrecen esto servicios profesionales. La psicoterapia es parte de estos servicios y quienes lo brindan son profesionales especializados en la materia, los cuales atienden a pacientes de diferentes edades y estratos socioeconómicos. Estos tratamientos suelen durar mucho tiempo, por lo que muchos pacientes, por diferentes circunstancias, abandonan el proceso al poco tiempo de haberlo iniciado. La institución, el cual es el caso de estudio, maneja ciertos niveles de deserción medibles durante el tiempo. Estos niveles son manejables en el grado en el que se dan, sin embargo, un creciente aumento del mismo podría generar costos para mantener el equilibrio, el cual deberá ser aplicado a los pacientes, los cuales podrían sentir incomodidad y afectar el proceso terapéutico. La necesidad de tener un mayor control sobre los niveles de deserción y reducirlos ayudaría en gran medida a mejorar la calidad de los servicios que se brindan en la institución. Para la institución, la incertidumbre del abandono en el proceso no permite aplicar medidas correctivas que permitan mejorar los niveles de deserción, sin embargo, la información contenida en la base de datos institucional permite, por cuestiones de investigación, estudiar y analizar los patrones que conllevan al abandono del proceso. Realizar este tipo de análisis sobre una gran cantidad de información implica utilizar métodos computacionales que permitan ayudar a analizar la información de una forma rápida y eficiente. Es por ello, que surge la necesidad de apoyarnos en las ciencias de la computación, específicamente en la minería de datos, para identificar los patrones que permitan predecir y determinar la permanencia de los pacientes durante el proceso. El presente proyecto de fin de carrera pretende entender las causales de la deserción en un proceso psicoterapéutico con el fin de poder predecir, desde el primer contacto entre el paciente y la institución, la permanencia del paciente. Para esto, se plantea el desarrollo de un prototipo funcional que permita predecir la permanencia de los pacientes haciendo uso de algoritmos de árboles de decisión para la predicción. Para la elaboración del prototipo funcional y el cumplimiento de los objetivos, se hizo uso de la herramienta Weka, el cual permitió analizar y seleccionar el algoritmo a usar para la implementación del prototipo. El desbalanceo de clases dificulto el proceso de análisis algorítmico, por tal motivo, se aplicaron métodos de minería de datos para analizar los conjuntos de datos desbalanceados. El lenguaje de programación usado fue Java y los algoritmos que permitieron la predicción fueron incorporados desde las librerías del API de Weka. Los resultados obtenidos fueron satisfactorios, en base a los datos que fueron extraídos de la base de datos institucional.
  • Item
    Algoritmo para el balanceo dinámico del grado de dificultad mediante aprendizaje de máquina en la implementación de un juego orientado a apoyar el desarrollo de la inteligencia espacial en niños de etapa pre-escolar
    (Pontificia Universidad Católica del Perú, 2018-03-27) Caballero Torres, Franco André; Beltrán Castañón, César Armando
    Dentro del ámbito educativo nacional, la Inteligencia espacial, a pesar de haber demostrado estar relacionada con una serie de habilidades que permiten y estimulan la creación y el desarrollo matemático y científico, no es muy reconocida y posee pocas herramientas que ayuden a su desarrollo en niños de edad preescolar, etapa en la que este se recomienda ampliamente. Sumado a esto encontramos la necesidad de herramientas que contribuyan en la enseñanza cuyos requerimientos han crecido en cantidad y complejidad en las últimas décadas, y que involucren modos innovadores de llevar el conocimiento aprovechando las tecnologías disponibles. La necesidad de contribuir con la educación también surge de los requerimientos del Aprendizaje Adaptativo, el cual es una metodología que, a través de la adecuación del nivel del contenido que se desea enseñar, permite al estudiante una experiencia de aprendizaje personalizada y más efectiva en resultados. Esta metodología aprovecha las posibilidades de interacción que proporcionan las tecnologías de información y la capacidad de procesamiento de los equipos informáticos para lograr su objetivo. La presente tesis describe el desarrollo de una aplicación educativa gamificada de apoyo en el desarrollo de la Inteligencia espacial en niños de etapa preescolar, e involucra el uso de tecnologías que permitan adaptar al estudiante la dificultad del juego presentado por el aplicativo. Para esto se hizo uso de métodos de Ajuste Dinámico de la Dificultad, a través de redes neuronales y aprendizaje supervisado. El entorno de juego está basado en el uso de representaciones virtuales de bloques lógicos, mediante los cuales se le presenta al alumno una figura la cual este debe imitar manipulando, mediante la pantalla táctil, otro conjunto bloques similares. Se evaluaron siete métricas en el desempeño del usuario relacionadas a cuan correcta es su respuesta en los siguientes conceptos: Encaje, ubicación, forma, tamaño, color, rotación y textura. Mediante estas métricas la aplicación elige el siguiente escenario a presentar al usuario ajustando diez atributos en dicho escenario. El proceso de adaptación busca introducir las métricas del usuario a un rango de acierto deseado y se realiza en dos pasos. Primero, se realiza sin presencia del usuario un entrenamiento de redes neuronales mediante propagación hacia atrás con información de casos base. Este primer paso permite obtener una versión inicial de la adaptabilidad. Y segundo, luego de cada ronda, se evalúa la respuesta del usuario mediante un conjunto de eventos que determinan la efectividad de la red neuronal para introducir a un usuario especifico al rango deseado, y se modifica la red usada para ese usuario con los resultados obtenidos. En los resultados del proyecto se observó que la metodología empleada es efectiva para el caso propuesto, logrando introducir las métricas en el rango luego de un número de rondas jugadas. La evaluación de requerimientos computacionales (velocidad, efectividad, robustez y eficiencia) y funcionales (claridad, variedad, consistencia y escalabilidad) para una AI adaptativa también muestra resultados positivos. Sobre la rapidez de la solución, la respuesta para ambos modelos (solo entrenamiento inicial y modificación por eventos) es imperceptible para el usuario. En cuanto eficacia se logró resultados positivos, logrando mejorar las métricas respecto a un algoritmo manual en más del 70% de los casos y obteniendo un aumento promedio comparándola a un algoritmo manual de +0.012 para las redes neuronales y +0.02 para el aprendizaje supervisado. Estos valores representan el 13% y el 22% de la máxima mejora posible respectivamente. En cuanto a la robustez y eficacia, ambos modelos lograron adaptar la respuesta al usuario en la mayoría de casos y en un número similar de rondas, aunque el aprendizaje supervisado mostró ser más efectivo en el primer criterio, mejorando los resultados del algoritmo manual. Respecto a la variedad de los escenarios presentados se obtuvo, mediante la modificación por eventos, una menor variación entre estos, lo que se relaciona con la mejor adaptabilidad alcanzada. Y sobre la escalabilidad, ambos modelos mostraron resultados positivos para los tres niveles de desempeño evaluado, aunque el aprendizaje supervisado muestra ser más efectivo. Estos resultados permiten identificar beneficios en el uso de esta metodología específicamente para el ámbito evaluado, así como identificar en qué casos específicos es más efectiva. Los resultados positivos encontrados que en conjunto indican que se ha logrado realizar una aplicación que cumple en presentar al usuario un entorno adaptativo, hacen válido el seguir este camino para futuras investigaciones en la exploración de las aplicaciones gamificadas educativas de apoyo a la inteligencia espacial.
  • Item
    Diagnóstico automático de Roya Amarilla en hojas de cafeto aplicando técnicas de procesamiento de imágenes y aprendizaje de máquina
    (Pontificia Universidad Católica del Perú, 2018-03-09) Barriga Pozada, Alfonso Carlos Cesar; Arrasco Ordoñez, Carlos Salvador; Beltrán Castañón, César Armando
    Actualmente, el café es uno de los recursos naturales más consumidos tanto en el mundo como en el Perú, Por ello, es menester garantizar la calidad en los granos de café, pues esto afectará considerablemente en el precio y posicionamiento en mercados altamente competentes; asimismo, el cultivo de este representa el principal ingreso para algunas familias, el cual se ve amenazado entre otras plagas, por la más perniciosa: La Roya Amarilla. La Roya Amarilla se propaga fácilmente a través del aire, una vez que cae en un cultivo de café, ataca directamente en las hojas, almacenándose en forma de esporas en el envés de estas, y al paso de días consume las hojas hasta defoliar completamente la planta infectada. Debido a ello, la planta no puede adquirir los nutrientes necesarios del sol, pues necesita las hojas como receptores; en consecuencia, el fruto del café (granos) no se desarrollan con normalidad, y por ende su calidad y cantidad de cosecha es baja. Aun cuando no existe una solución absoluta para la erradicación de esta plaga, se la puede controlar; es decir, a través de un proceso manual y exhaustivo los caficultores pueden aplicar una solución bioquímica en la planta que detenga el desarrollo del hongo en las hojas, pero no acaba con ellas, solo se puede prolongar el tiempo de vida de la planta de café. Esto es posible, solo si se detecta en sus inicios la presencia de las esporas en las hojas, pues de haber germinado el hongo sería en vano cualquier intento de recuperar la planta, con lo que solo quedaría el exterminio de la planta. Frente a este panorama, se propone una solución a través del aprendizaje máquina y procesamiento de imágenes, con el fin de automatizar el proceso de detección de la Roya en las hojas y calcular de manera más precisa la severidad del hongo. El proceso comienza en tomar fotografías a las hojas en un espacio semi controlado (con fondo blanco), luego se guardan todas las imágenes de las que se quiera conocer el porcentaje de severidad y ejecutar el programa propuesto, al término de ello el software muestra un reporte estadístico con el grado de incidencia por hoja según la clasificación de severidad que corresponda. Finalmente, destacar que, de manera funcional, el aprendizaje máquina será vital para descartar si hay presencia de roya en la hoja analizada, y luego si la hoja está infectada, con el método de procesamiento de imágenes se calculará de manera más precisa el porcentaje de severidad considerando el área de la hoja examinada.
  • Item
    Caracterización y clasificación automática de ríos en imágenes satelitales
    (Pontificia Universidad Católica del Perú, 2017-06-16) Brown Manrique, Kevin; Beltrán Castañón, César Armando
    En los últimos años, el fenómeno conocido como cambio climático se está volviendo cada vez más notorio. Como resultado de este fenómeno, uno de los sectores que se verá más afectado será el de los recursos hídricos debido al impacto que se tendrá sobre el ciclo hidrológico y en los sistemas de gestión de agua, y a través de estos, en los sistemas socioeconómicos. Uno de los impactos conocidos es el conjunto de modificaciones en los patrones de precipitación y caudal de los ríos que afectarán a todos sus usuarios. Los caudales de ríos se forman por sedimentos que han sido y están siendo transportados por agua que fluye y por lo general se pueden clasificar en 4 formas básicas: rectos, meandros, trenzados y anastomosados. Es importante el tener reconocidos los distintos ríos y para ello no basta con conocer su localización sino además tener mapeadas las características de estos según su canal aluvial. Uno de los métodos tradicionales para caracterizar la morfología de un río (anchura, sinuosidad, características de inundación, etc.) es a través de trabajo de campo, que es costoso y demanda tiempo. Estos métodos no sólo consumen tiempo, sino que además, son extremadamente difíciles de llevar a cabo debido a que están sujetos a factores como inundaciones, mareas y tormentas que pueden hacer el lugar inaccesible y peligroso para recolectar información. El presente proyecto de fin de carrera propone una solución ante el problema de la dificultad y alto costo que supone la realización del trabajo de campo que permita caracterizar la morfología de un río. La solución planteada es una nueva técnica computacional para la caracterización automática de la morfología de los ríos, Dimensión Fractal Multi-escala, el cual aprovecha las características fractales de formación de elementos naturales como los ríos. El proyecto inicia con un proceso de limpieza de ruido a los datos de entrada que son esqueletos de ríos, para luego, por cada uno, aplicar el método de Crossing Number para obtener la multiplicidad de canal. Seguidamente, se elaborará una Curva Fractal aplicando el método de Dimensión Fractal Multiescala y de la curva obtenida se extraerán puntos de interés para generar un vector de características necesario para la clasificación. A continuación, se entrenará un clasificador empleando los vectores de características para generar un modelo predictivo. Finalmente, el modelo será evaluado mediante la clasificación de un nuevo esqueleto de río.
  • Item
    Registro automático de imágenes digitales de campos de cultivo aplicada a la agricultura de precisión con vehículos aéreos no tripulados
    (Pontificia Universidad Católica del Perú, 2017-03-09) Melgarejo Román, Lucía Alejandra; Beltrán Castañón, César Armando
    El presente proyecto de fin de carrera busca presentar un aporte al campo de la agricultura de precisión, el cual tiene como propósito aplicar y desarrollar nuevos mecanismos tecnológicos para optimizar las tareas involucradas en la agricultura. Una de las herramientas dentro de la agricultura de precisión es la percepción remota, con la cual se pueden obtener imágenes de los campos de cultivo a gran altura, permitiendo la identificación de características que no son fácilmente visibles cuando se está al nivel del suelo. Las imágenes capturadas mediante la percepción remota son empleadas por diversos especialistas en la interpretación de determinados índices de vegetación, cuyos resultados ayuden a facilitar y mejorar las tareas del agricultor. La captura de dichas imágenes es obtenida a través de sensores remotos colocados en satélites, aviones y actualmente, el uso de vehículos aéreos no tripulados (Unmanned Aerial Vehicle – UAV) ha sufrido un considerable incremento. Sin embargo se presentan algunos inconvenientes con respecto al procesamiento de las imágenes adquiridas por los UAVs. En primer lugar debido a la necesidad de monitoreo constante, es necesario que los UAVs sobrevuelen la zona a tratar periódicamente, generando una gran cantidad de imágenes de una misma zona a tratar en diferentes periodos de tiempo, resultando que en cada captura las imágenes de la misma zona presentan distintas características: traslación y rotación espacial (considerando un punto de referencia fijo) e iluminación. En segundo lugar, debido a la necesidad de determinación de parámetros de vegetación, temperatura, humedad, entre otros, es necesaria la obtención de imágenes con cámaras que trabajen en diferentes bandas del espectro electromagnético (bandas de color azul, rojo, verde e infrarrojo). En algunas ocasiones una sola cámara no trabaja en todas las bandas del espectro por lo que se requiere colocar más de una cámara en el UAV, con el resultado de que las imágenes capturadas de una misma zona no están alineadas espacialmente debido a la posición de las cámaras en el UAV. De este modo se hace necesario de algún método que permita la alineación de las imágenes capturadas por los UAVs, ya sea que estas provengan de diferentes puntos de vista o de diferentes sensores, para una misma zona a tratar. Al procedimiento requerido para la alineación de dos o más imágenes de un mismo objeto de interés se le conoce como registro de imágenes.
  • Item
    Extracción de descriptores de color y textura en imágenes digitales de plantas para la identificación de especímenes botánicos
    (Pontificia Universidad Católica del Perú, 2017-02-15) Oncevay Marcos, Félix Arturo; Beltrán Castañón, César Armando
    La identificación de la clasificación taxonómica de las plantas es un proceso realizado generalmente de forma manual por los especialistas botánicos en base a su experiencia. Sin embargo, la enorme variedad de especies de plantas, y la dificultad en la selección de propiedades o cualidades propias que permitan estimar una clasificación de las mismas, conforman un reto científico que se ha trasladado a un aspecto tecnológico para automatizar y apoyar dicho proceso. Por este motivo, se han propuesto diversos métodos desde los campos de reconocimiento de patrones y visión computacional para la identificación automática de las especies de plantas. Para esto, se suelen utilizar imágenes digitales de las hojas, debido a que esta es la parte de la planta que presenta una gran riqueza de atributos visuales como el color y la textura, que son objeto de esta investigación. En la investigación propuesta, se extraerán y combinaran diferentes grupos de descriptores de color y textura de las hojas en imágenes digitales escaneadas. Con dichos atributos, se entrenan algoritmos de aprendizaje de máquina para generar un modelo de clasificación que permita distinguir las especies de las plantas con una precisión aceptable según el estado del arte del problema. Para esto, se realizará un caso de estudio sobre el conjunto de imágenes de plantas: \ImageCLEF 2012", el cual posee un catálogo digital de hasta 115 especies botánicas diferentes.
  • Item
    Segmentación automática de la planta de pie en imágenes termográficas en entorno ruidoso para el diagnóstico de pie diabético
    (Pontificia Universidad Católica del Perú, 2016-09-19) Alpiste Pomalaza, Marko André; Beltrán Castañón, César Armando
    La diabetes es un problema social cada vez más presente en nuestro país debido a los cambios en el estilo de vida de las personas. Este proyecto de fin de carrera busca apoyar a la prevención de la diabetes tipo 2 mostrando un algoritmo de segmentación automática de la planta de los pies que calcula la diferencia de temperatura entre ambos, a fin de que apoye al estudio que propone el poder prevenir la aparición de dicha enfermedad según el valor promedio de la diferencia de temperatura entre ambas plantas. Para dicho fin se realizara un programa en MatLab que implemente dicho algoritmo que procese imágenes termográficas en entornos ruidosos y que calcule la diferencia de temperaturas promedio entre ambas plantas del pie de la imagen en cuestión, mostrándolo adicionalmente de forma gráfica.