Ingeniería Informática

Permanent URI for this collectionhttp://54.81.141.168/handle/123456789/9139

Browse

Search Results

Now showing 1 - 10 of 23
  • Item
    Aprendizaje automático no supervisado en segmentadores morfológicos para una lengua de escasos recursos caso de estudio: SHIWILU
    (Pontificia Universidad Católica del Perú, 2023-06-27) Asmat Ramirez, Evelyn Fiorella; Zapata del Río, Claudia María del Pilar; Oncevay Marcos, Felix Arturo
    El Shiwilu es considerada ‘seriamente en peligro’ porque es hablada principalmente por adultos mayores de forma parcial, poco frecuente y en contextos restringidos; además, no continúa siendo transmitida a nuevas generaciones. Este tipo de lenguas necesitan pasar por un proceso de revitalización (fortalecimiento) para garantizar que no se extingan y así fomentar el interés de sus hablantes. Además, su documentación es muy escasa debido a los pocos estudios lingüísticos realizados. A fin de elevar su status, se sugiere la creación de recursos y tecnología de corte lingüístico, como corpus monolingüe y bilingüe, diccionarios, reconocimiento de categorías gramaticales, analizadores morfológicos, etc. Sin embargo, la mayoría de las lenguas existentes no se beneficia con alguno de estos recursos y/o tecnologías, y por ello son consideradas como lenguas de escasos recursos. Debido a la falta de inversión, se requiere un enfoque en el que se busquen soluciones robustas a un bajo costo a través de herramientas independientes de la lengua, modelos de desarrollo de código abierto o algoritmos de aprendizaje automático no supervisado. Bajo este contexto, se identifica como problema central el desconocimiento de un enfoque adecuado para la segmentación morfológica de una lengua de escasos recursos; y para ello, el presente proyecto propone realizar una segmentación morfológica automática no supervisada en una lengua con estas características a partir de la identificación del tipo de enfoque, monolingüe o multilingüe, que ofrece mejores resultados en esta tarea.
  • Item
    Desarrollo de un Framework para la identificación del nivel de complejidad de texto para el entrenamiento de chatbots basado en Machine Learning
    (Pontificia Universidad Católica del Perú, 2022-03-21) Matos Rios, Hans; Beltrán Castañón, César Armando
    La generación de diálogo implica diseñar un programa para generar una conversación natural, esto requiere desarrollar algoritmos que puedan conversar con un ser humano y otro programa de manera coherente y fluida. Desarrollar una conversación también depende del contexto y conocimiento del interlocutor, lo cual nos lleva a definir la existencia de niveles de complejidad conversacional, la cual se refiere a determinar que tan fácil o difícil de leer es un texto. En este aspecto, especialmente para el idioma español, no existe una herramienta que tenga un módulo propio que le permita clasificar textos en español por su complejidad textual. En el presente trabajo de fin de carrera se realiza el desarrollo de un módulo en el lenguaje de programación Python, el cual funciona como un Framework para identificar la complejidad textual de textos en español usando técnicas de Machine Learning. Para ello, en primer lugar, se implementaron 48 métricas de análisis de complejidad textual basadas en Coh-Metrix usando el lenguaje de programación Python. Dichas métricas convierten textos en español en datos numéricos con los cuales se entrenaron distintos modelos de Machine Learning, con el motivo de obtener el mejor modelo a utilizar con el Framework desarrollado, siendo este capaz de utilizar un modelo personalizado provisto por el usuario. Para ello, se necesitó obtener un corpus de 183 textos en español para realizar dicho entrenamiento, el cual fue obtenido al descargar textos educativos de nivel primaria y secundaria. Por último, se entrenó un chatbot con los textos obtenidos para el corpus, cuyas respuestas generadas fueron analizados con el Framework previamente desarrollado, identificando que el nivel de complejidad de dichas respuestas correspondía al nivel de los textos con los cuales el chatbot fue entrenado. En conclusión, en el presente proyecto de investigación se desarrolla un módulo de Python que funciona como un Framework, el cual es capaz de identificar la complejidad textual de textos en español, ya sea con el mejor modelo de Machine Learning utilizado en el presente proyecto o utilizando uno provisto por el usuario de la herramienta.
  • Item
    Implementación de un algoritmo de aprendizaje profundo basado en eventos para el problema de predicción de movimiento bursátil
    (Pontificia Universidad Católica del Perú, 2021-11-30) Bustamante Arce, Jaime Diego; Beltrán Castañón, César Armando
    La predicción de precios bursátiles, acciones e índices siempre ha sido un tema de interés en el mundo financiero, no solo por su capacidad de originar grandes rentabilidades en poco tiempo, sino también por su volatilidad y complejidad. Así, desde que los mercados bursátiles fueron concebidos diferentes investigadores en variadas áreas han tratado de “vencerlo” prediciendo su comportamiento, como el índice S&P 500 que lista la cotización de las 500 corporaciones más líquidas de la Bolsa de New York. Uno de los enfoques es el fundamentalista, que busca predecirlo de acuerdo a las noticias en los medios de las empresas listadas en la Bolsa de Valores. Desde el lado informático, diversas técnicas han venido siendo aplicadas para realizar esta predicción como estadísticas y las clásicas herramientas de aprendizaje de máquina. Sin embargo, con el creciente aumento de volumen de información, se hace necesario aplicar técnicas que consigan lidiar con esta información no estructurada. Técnicas como redes profundas recurrentes (LSTM), se han mostrado ad-hoc para el manejo de información temporal, debido a que tienen de capacidad de memorizar hechos pasados, que persisten en el tiempo. En el presente trabajo se propone una metodología y conjunto de redes neuronales profundas para la predicción de movimiento bursátil a partir de eventos y noticias corporativas. Para ello no solo se considera la contextualización de palabras, sino también sus relaciones y composición semántica, estructura e historia para la predicción del índice S&P 500. En resumen, el presente proyecto obtiene resultados exitosos puesto que sobrepasan a los del estado del arte. Así, el conjunto de modelos neuronales propuestos puede ser usados como apoyo en la decisión de inversión diaria en el índice S&P 500.
  • Item
    Algoritmo Cuckoo Search para la planificación de citas de recepción de materia prima en empresas de producción multiplanta
    (Pontificia Universidad Católica del Perú, 2021-05-18) Labajos Trigoso, Steven Alonso; Cueva Moscoso, Rony
    En la actualidad, una planificación adecuada de citas de recepción de materia prima es un factor clave en las empresas productoras, ya que se debe garantizar la disponibilidad de los insumos cuando los procesos productivos los requieran. De lo contrario, se corre el riesgo de no poder satisfacer la demanda y de obstaculizar las operaciones de la empresa, generando un incremento en los costos. Dada la alta complejidad involucrada en realizar una planificación de citas de recepción, debido al número de variables y restricciones que utiliza, este tipo de problema se clasifica como NPdifícil, por lo que resolverlo mediante técnicas determinísticas o matemáticas resulta muy complejo. Por ello, para resolver este tipo de problemas se utilizan técnicas metaheurísticas, las cuales proveen algoritmos eficientes y prácticos que permiten obtener soluciones de calidad en un tiempo razonable. En este proyecto de tesis se utiliza el algoritmo Cuckoo Search para resolver el problema de planificación de citas de recepción de materia prima en empresas de producción multipla nta, ya que, a pesar de su desarrollo reciente, está demostrando tener excelentes resultados al resolver problemas de optimización, debido a su rápida convergencia y robusta búsqueda global. Además, no se ha encontrado en la literatura una aplicación del algoritmo mencionado para el problema que se desea resolver. Se desarrolla también una aplicación del algoritmo genético para el caso estudiado, siendo este uno de los más representativos y populares para resolver problemas de optimización, con la finalidad de validar la eficiencia del algoritmo Cuckoo Search respecto a uno de los más usados en la actualidad.
  • Item
    Sistema de programación, administración y monitoreo de unidades de transporte para el despacho de mercadería en rutas del interior del país
    (Pontificia Universidad Católica del Perú, 2019-09-10) Moharam Bonilla, Sameer Ernesto; Cueva Moscoso, Rony
    El transporte de mercadería es una actividad muy importante para las empresas dedicadas al comercio de productos. Por lo general las entregas se programan en fechas exactas para cumplir con las solicitudes del cliente. No obstante, hay varios riesgos asociados a esta actividad (como asaltos, desastres naturales y tráfico), los cuales generan demora que pueden afectar negativamente el nivel de satisfacción de los clientes. El presente trabajo de fin de carrera busca brindar una herramienta de soporte a la actividad de transporte de mercadería. Con el fin de reducir el tiempo de las entregas realizadas por cada unidad, se plantea utilizar un algoritmo metaheurístico que asigne adecuadamente las órdenes de despacho a los vehículos de transporte. Asimismo se propone proveer al chofer de una ruta óptima para su desplazamiento, buscando minimizar el tiempo entre cada punto de entrega. Finalmente, también se propone monitorear la ubicación de los vehículos de transporte durante su trayecto, lo que hace posible detectar rápidamente cualquier desvío de la unidad sobre la ruta establecida. Para lograr las funcionalidades mencionadas se integrará la solución en un sistema web y un aplicativo móvil. El sistema web se utilizará para administrar las órdenes de despacho y para mostrar la ubicación de las unidades de transporte. El aplicativo móvil registrará la ubicación de la unidad de transporte y mostrará al chofer la mejor ruta para llegar a su destino.
  • Item
    Implementación del algoritmo metaheurístico Cuckoo Search para la optimización de cortes en dos dimensiones de productos cerámicos con defectos para la producción de piezas decorativas
    (Pontificia Universidad Católica del Perú, 2019-05-29) Monzón Durand, Javier Alexander; Cueva Moscoso, Rony
    Los residuos generados por los cortes de cerámicos son uno de los principales factores de desperdicio en la industria de baldosas y cerámicos, el cual se estima en una pérdida de alrededor 40% del material cerámico utilizado. Por este motivo, la reducción de los residuos de materiales utilizados en la fabricación de los productos cerámicos es una parte fundamental para la reducción de costos de producción. Asimismo, es importante mencionar que en esta industria es posible encontrar defectos en el material a recortar, una restricción de la cual carecen la mayoría de investigaciones que abordan el problema. Seleccionar el ordenamiento con menor desperdicio de las piezas a recortar, en términos de complejidad computacional, se considera como un problema del tipo NPdifícil (polinómico no determinístico), el cual toma mucho tiempo para encontrar una solución exacta y lo hace inviable de aplicar en la industria. Es por ello que se justifica el uso de métodos heurísticos para obtener aproximaciones a la solución óptima en un tiempo menor. El presente trabajo de fin de carrera presenta una metaheurística Cuckoo Search para resolver el problema de corte de material expuesto como alternativa de solución al algoritmo genético, muy utilizado en este tipo de problemas de optimización. El algoritmo Cuckoo Search es una técnica de reciente desarrollo y ha mostrado buen desempeño en otro tipo de problemas de optimización y hasta el momento no se ha intentado atacar el problema usan esta metaheurística. Para medir el desempeño del algoritmo Cuckoo Search, se hace uso de una adaptación del algoritmo genético encontrado en la literatura para la misma variante del problema de corte de material. El algoritmo genético es utilizado en este trabajo para comparar el desempeño del algoritmo Cuckoo Search propuesto mediante una experimentación numérica. Se concluye que el algoritmo genético tiene mejor desempeño que el algoritmo Cuckoo Search para el conjunto de datos utilizado en el proyecto, sin embargo, los resultados obtenidos de este último siguen siendo prometedores para ser utilizado por las empresas de la industria de cerámicos.
  • Item
    Implementación de un Algoritmo Murciélago para la Planificación de Inspecciones de Mantenimiento de aeronaves aplicado a aerolíneas comerciales
    (Pontificia Universidad Católica del Perú, 2019-04-23) Soto Flores, Luis Angel Eduardo; Cueva Moscoso, Rony
    El continuo crecimiento de la demanda en vuelos comerciales ha ocasionado que las diversas aerolíneas se vean en la necesidad de reducir sus costos de mantenimiento para poder maximizar la utilización de su flota de aeronaves con el fin de poder obtener una rentabilidad deseada. La variedad de tipos de avión, la creciente cantidad de vuelos y un mayor número disponible de aeronaves complican el proceso mediante el cual se asignan rutas de vuelo a cada avión y su respectiva base de mantenimiento cuando se quiera una inspección. Ante esta nueva dificultad, un creciente número de investigaciones se han llevado a cabo para dedicarse a diseñar algoritmos capaces de obtener una buena planificación de inspecciones de mantenimiento utilizando la menor cantidad de recursos. Los algoritmos planteados han ido creciendo en tema de complejidad a medida que han pasado los años. Los primeros métodos que fueron planteados se denominaban algoritmos exactos, estos algoritmos podían obtener la respuesta optima, pero utilizando un gran poder de procesamiento y tiempo de ejecución. Luego se hizo uso de algoritmos heurísticos que entregaban soluciones buenas, que posiblemente no eran las óptimas, pero con un menor consumo de recursos. En la actualidad, se han diseñado varios algoritmos metaheurísticos realizando mejoras continuas a la solución obtenida hasta que se llegue a cierto criterio de terminación. El objetivo del presente proyecto de fin de carrera es diseñar e implementar un algoritmo murciélago hibrido que minimice los costos en la planificación de inspecciones de mantenimiento y a la vez maximice los posibles beneficios al aprovechar las horas de vuelo de las aeronaves. Para cumplir con el objetivo planteado se hará un estudio de los conceptos asociados a la planificación de mantenimiento y se recopilaran datos reales a planificaciones de mantenimiento hechas por aerolíneas del presente mercado peruano. El producto final será un algoritmo murciélago hibrido diseñado y calibrado para obtener soluciones que sean válidas para el contexto nacional.
  • Item
    Diseño de un modelo algorítmico para la discriminación de patrones acústicos entre voces y pisadas humanas
    (Pontificia Universidad Católica del Perú, 2019-03-29) Viera Barthelmes, Cecilia del Pilar; Beltrán Castañón, César Armando
    Actualmente existe una gran demanda de soluciones innovadoras e informáticas que permitan generar sistemas de vigilancia o que ayuden en esta labor. Es así como se han generado diversos proyectos que buscan satisfacer las necesidades de sistemas de este tipo. Mayormente, se ha utilizado la tecnología de imágenes y utilizando drones o algún tipo de cámara, donde una persona está monitoreando estas imágenes captadas en tiempo real para verificar la presencia de un objeto o un ser no deseado. Sin embargo, estas soluciones han presentado una gran complejidad tanto en procesamiento como infraestructura, conllevando así también a un precio elevado de su implantación. Es por esto que este proyecto de investigación se enfoca en presentar una solución a este problema utilizando recursos más simples, basándose en un reconocimiento de patrones en señales acústicas. Esta es un área de la especialidad de informática que en los últimos años ha tenido un gran desarrollo y estudio debido a las diversas aplicaciones que puede tener en el mundo contemporáneo. Cada vez se han ido perfeccionando los algoritmos de extracción de características y de aprendizaje de máquina, por lo cual en este trabajo se utilizarán y compararán dos métodos de caracterización estudiados en investigaciones de reconocimiento de voz. Además, se desarrollará un módulo de recorte de la señal que permita identificar a las regiones de interés. Finalmente, se usarán redes neuronales como el clasificador del algoritmo.
  • Item
    Algoritmo para el balanceo dinámico del grado de dificultad mediante aprendizaje de máquina en la implementación de un juego orientado a apoyar el desarrollo de la inteligencia espacial en niños de etapa pre-escolar
    (Pontificia Universidad Católica del Perú, 2018-03-27) Caballero Torres, Franco André; Beltrán Castañón, César Armando
    Dentro del ámbito educativo nacional, la Inteligencia espacial, a pesar de haber demostrado estar relacionada con una serie de habilidades que permiten y estimulan la creación y el desarrollo matemático y científico, no es muy reconocida y posee pocas herramientas que ayuden a su desarrollo en niños de edad preescolar, etapa en la que este se recomienda ampliamente. Sumado a esto encontramos la necesidad de herramientas que contribuyan en la enseñanza cuyos requerimientos han crecido en cantidad y complejidad en las últimas décadas, y que involucren modos innovadores de llevar el conocimiento aprovechando las tecnologías disponibles. La necesidad de contribuir con la educación también surge de los requerimientos del Aprendizaje Adaptativo, el cual es una metodología que, a través de la adecuación del nivel del contenido que se desea enseñar, permite al estudiante una experiencia de aprendizaje personalizada y más efectiva en resultados. Esta metodología aprovecha las posibilidades de interacción que proporcionan las tecnologías de información y la capacidad de procesamiento de los equipos informáticos para lograr su objetivo. La presente tesis describe el desarrollo de una aplicación educativa gamificada de apoyo en el desarrollo de la Inteligencia espacial en niños de etapa preescolar, e involucra el uso de tecnologías que permitan adaptar al estudiante la dificultad del juego presentado por el aplicativo. Para esto se hizo uso de métodos de Ajuste Dinámico de la Dificultad, a través de redes neuronales y aprendizaje supervisado. El entorno de juego está basado en el uso de representaciones virtuales de bloques lógicos, mediante los cuales se le presenta al alumno una figura la cual este debe imitar manipulando, mediante la pantalla táctil, otro conjunto bloques similares. Se evaluaron siete métricas en el desempeño del usuario relacionadas a cuan correcta es su respuesta en los siguientes conceptos: Encaje, ubicación, forma, tamaño, color, rotación y textura. Mediante estas métricas la aplicación elige el siguiente escenario a presentar al usuario ajustando diez atributos en dicho escenario. El proceso de adaptación busca introducir las métricas del usuario a un rango de acierto deseado y se realiza en dos pasos. Primero, se realiza sin presencia del usuario un entrenamiento de redes neuronales mediante propagación hacia atrás con información de casos base. Este primer paso permite obtener una versión inicial de la adaptabilidad. Y segundo, luego de cada ronda, se evalúa la respuesta del usuario mediante un conjunto de eventos que determinan la efectividad de la red neuronal para introducir a un usuario especifico al rango deseado, y se modifica la red usada para ese usuario con los resultados obtenidos. En los resultados del proyecto se observó que la metodología empleada es efectiva para el caso propuesto, logrando introducir las métricas en el rango luego de un número de rondas jugadas. La evaluación de requerimientos computacionales (velocidad, efectividad, robustez y eficiencia) y funcionales (claridad, variedad, consistencia y escalabilidad) para una AI adaptativa también muestra resultados positivos. Sobre la rapidez de la solución, la respuesta para ambos modelos (solo entrenamiento inicial y modificación por eventos) es imperceptible para el usuario. En cuanto eficacia se logró resultados positivos, logrando mejorar las métricas respecto a un algoritmo manual en más del 70% de los casos y obteniendo un aumento promedio comparándola a un algoritmo manual de +0.012 para las redes neuronales y +0.02 para el aprendizaje supervisado. Estos valores representan el 13% y el 22% de la máxima mejora posible respectivamente. En cuanto a la robustez y eficacia, ambos modelos lograron adaptar la respuesta al usuario en la mayoría de casos y en un número similar de rondas, aunque el aprendizaje supervisado mostró ser más efectivo en el primer criterio, mejorando los resultados del algoritmo manual. Respecto a la variedad de los escenarios presentados se obtuvo, mediante la modificación por eventos, una menor variación entre estos, lo que se relaciona con la mejor adaptabilidad alcanzada. Y sobre la escalabilidad, ambos modelos mostraron resultados positivos para los tres niveles de desempeño evaluado, aunque el aprendizaje supervisado muestra ser más efectivo. Estos resultados permiten identificar beneficios en el uso de esta metodología específicamente para el ámbito evaluado, así como identificar en qué casos específicos es más efectiva. Los resultados positivos encontrados que en conjunto indican que se ha logrado realizar una aplicación que cumple en presentar al usuario un entorno adaptativo, hacen válido el seguir este camino para futuras investigaciones en la exploración de las aplicaciones gamificadas educativas de apoyo a la inteligencia espacial.
  • Item
    Implementación de algoritmos meta heurísticos para la definición de frecuencias y horarios para rutas de transporte público
    (Pontificia Universidad Católica del Perú, 2017-08-26) Sato Yamada, José Miguel; Alva Manchego, Fernando Emilio
    En los últimos años, se han implementado servicios como el Metropolitano y el Metro que buscan aliviar la congestión vehicular que se genera en las calles de Lima. Si bien estos nuevos servicios han logrado disminuir el tiempo de viajes de los pasajeros, estos aun presentan algunos de los inconvenientes que tienen los viajes en buses y combis tradicionales, como son la falta de capacidad para satisfacer la demanda de los pasajeros y la poca confiabilidad de los servicios. Problemas como estos se deben a deficiencias en el diseño de la red de transporte, este consiste en cinco pasos (Kepaptsoglou y Karlaftis 2009, p 491) los cuales son: Definición de rutas, definición de frecuencias, definición de horarios, asignación de unidades y asignación de choferes. La falta de capacidad de los servicios para atender la demanda se debe a que las frecuencias de las unidades no están definidas correctamente; y la poca confiabilidad de los servicios se debe a que estas no tienen horarios establecidos que pueden ser usados para que los pasajeros sepan las horas de llegadas de las unidades o como una forma de control para la empresa. En el proyecto se buscó dar solución al problema de definición de las frecuencias y definición de horarios implementando algoritmos meta heurísticos que ayuden a definir frecuencias y horarios para cada una de las rutas que componen la red de transporte. Si bien en el proyecto se toma el caso del Metropolitano y el Metro, la solución puede ser utilizada en cualquier sistema de transporte que tenga rutas y demandas definidas. Primero fue necesario obtener toda la información relevante relacionada a la red de transporte, esta información fue procesada y colocada en archivos que son leídos por los algoritmos. Luego se diseñó la solución y la estructura de datos que se emplearan en el programa. Para poder definir las funciones objetivos fue necesario analizar los diferentes componentes que estos presentan. Para la implementación del programa primero se implementó las funciones objetivos, luego se realizó la generación de soluciones aleatorias y luego cada una de los algoritmos que contiene la solución, posteriormente se buscó mejorar la eficiencia de los algoritmos utilizando programación multi-hilos, se siguió los mismos para la definición de frecuencias y la definición de horarios. Una vez implementado todos los algoritmos se creó una interfaz de usuario que facilita el uso y configuración de los algoritmos.