Tesis y Trabajos de Investigación PUCP

URI permanente para esta comunidadhttp://54.81.141.168/handle/123456789/6

El Repositorio Digital de Tesis y Trabajos de Investigación PUCP aporta al Repositorio Institucional con todos sus registros, organizados por grado: Doctorado, Maestría, Licenciatura y Bachillerato. Se actualiza permanentemente con las nuevas tesis y trabajos de investigación sustentados y autorizados, así como también con los que que fueron sustentados años atrás.
Ingresa a su web: Repositorio Digital de Tesis y Trabajos de Investigación PUCP

Explorar

Resultados de búsqueda

Mostrando 1 - 10 de 10
  • Ítem
    Desarrollo de una aplicación de visión artificial para escanear objetos 3D con cámaras de fotos
    (Pontificia Universidad Católica del Perú, 2022-03-15) Sumoso Vicuña, Ernie Ludwick; Sipiran Mendoza, Iván Anselmo
    Los métodos tradicionales de escaneo 3D requieren de un contacto físico directo con los objetos a escanear. En algunos casos demandan incluso la rotación y movimiento constante de estos, lo cual representa un riesgo para objetos frágiles como las piezas arqueológicas. Si ignoramos este factor de riesgo podemos causar daños irreparables y frustrar el proceso de documentación de estas. Por otro lado, existen técnicas de escaneo 3D sin contacto - pasivas que no requieren de una interacción directa con los objetos. Es por ello que se propone desarrollar un software que permita escanear piezas arqueológicas usando las técnicas de reconstrucción tridimensional mediante conceptos de visión artificial, aprendizaje de máquina, data augmentation y mallas poligonales. Para lograr nuestro cometido se parte de un set inicial de 962 huacos peruanos pre escaneados proporcionados por el grupo de Inteligencia Artificial PUCP. Con este conjunto de datos se genera una extenso volumen de imágenes los cuales son procesados y utilizados para el entrenamiento de un modelo de aprendizaje de máquina. Segundo, al obtener unos primeros resultados se propone llevar a cabo la técnica de data augmentation para extender nuestra data disponible, normalizarla, segmentarla y con ello entrenar múltiples modelos bajo 2 experimentos definidos. Todo ello nos permite mejorar los resultados de reconstrucción de objetos 3D considerando la alta variabilidad de huacos peruanos. Finalmente se implementa una interfaz gráfica la cual permite al usuario interactuar con el proyecto desarrollado. En conclusión, se logra desarrollar una herramienta de software que nos permite cargar videograbaciones reales de piezas arqueológicas (bajo ciertos parámetros establecidos), procesar los archivos, visualizar y descargar los resultados obtenidos como mallas poligonales (reconstrucciones 3D almacenados en el computador).
  • Ítem
    Integración de imágenes de nubes de puntos obtenidas por drones
    (Pontificia Universidad Católica del Perú, 2021-09-16) Tippe Quintanilla, Percy Kim; Sipiran Mendoza, Iván Anselmo
    The Lidar technology is an environment scanning method that produces point cloud images. In this work we study the use of a Kalman filter to combine point cloud images into a single unified 3D map.
  • Ítem
    Reconocimiento de elementos de seguridad de billetes utilizando Transfer Learning
    (Pontificia Universidad Católica del Perú, 2021-08-12) Vera Muñoz, David; Sipiran Mendoza, Iván Anselmo
    La falsificación de moneda es un problema en el país y se evidencia en informes periodísticos de incautaciones de billetes y monedas falsificadas que aparecen cada cierto tiempo a nivel nacional; por lo tanto, la necesidad de un sistema de reconocimiento de billetes y monedas es imperativo dado que a la par del crecimiento tecnológico que apoye esta tarea, también la maquinaria y tecnología utilizada para la falsificación de billetes y monedas es más accesible y costeable. La identificación de billetes y monedas falsificadas ha estado enfocada en gran medida en el procesamiento de imágenes. En el presente artículo se utiliza un modelo basado en aprendizaje por transferencia que viene teniendo buenos resultados en problemas específicos de clasificación de imágenes en la actualidad. Se ha construido un conjunto de datos con imágenes de billetes genuinos y falsificados para el entrenamiento y pruebas del modelo. Los resultados obtenidos son muy alentadores y demandan un entrenamiento más robusto con una mayor cantidad de imágenes. Asimismo con algunas mejoras en la arquitectura se podría adaptar un modelo a una aplicación móvil de manera que pueda apoyar al ciudadano de a pie en la identificación de billetes falsificados en tiempo real.
  • Ítem
    Técnicas de representación y reconstrucción de objetos 3D en el computador: una revisión de literatura
    (Pontificia Universidad Católica del Perú, 2021-02-18) Sumoso Vicuña, Ernie Ludwick; Sipiran Mendoza, Iván Anselmo
    Actualmente en el mundo, las tecnologías de escaneo 3D se clasifican en dos grupos: de contacto y sin contacto. El primer grupo se caracteriza por la necesidad de reposar el escáner sobre el objeto (Sreenivasa K. 2003). Este tipo de escáneres representan un riesgo cuando los objetos en cuestión no pueden ser manipulados libremente debido a su fragilidad. Por otro lado, el segundo grupo de tecnologías son mayormente usadas en investigaciones y poseen una amplia variedad de aplicaciones en la industria medicinal y de entretenimiento. Este último grupo a su vez se divide en dos sub-grupos: activos y pasivos (Pears N. 2012). Las tecnologías de escaneo 3D activos se basan en el análisis y medición del tiempo de envío y retorno de una señal hacia el objeto para estimar la posición de la superficie. Por otro lado, las técnicas de escaneo sin contacto-pasivas no necesitan de la manipulación del objeto ni medición de señales ya que aprovechan la luz ambiental. Dentro de las ciencias de la computación existe el problema de cómo sintetizar, procesar y analizar la información de una superficie obtenida mediante herramientas de escaneo 3D y guardarla en el computador con el fin de que este pueda ser visualizada y/o manipulada por otras herramientas informáticas. A lo largo de los años han surgido múltiples técnicas de representación de objetos en un espacio de tres dimensiones. Sin embargo, estas técnicas dependen fuertemente de las herramientas empleadas durante el proceso de escaneo. Es por ello que se han desarrollado también técnicas pasivas-sin contacto que permitan la obtención de superficies únicamente a partir de una colección de imágenes y haciendo uso de redes neuronales entrenadas en extensos conjuntos de datos. Para poder entender estas tecnologías emergentes es necesario investigar a profundidad cuales son los recientes métodos para generar superficies u objetos 3D, en qué casos se utilizan los distintos métodos y cuáles son los enfoques de los autores al emplear dichas técnicas.
  • Ítem
    Visualización 3D de grandes cantidades de datos 3D para la prevención frente a desastres naturales: una revisión de la literatura
    (Pontificia Universidad Católica del Perú, 2020-11-25) Guillén Zapata, Handry James; Sipiran Mendoza, Iván Anselmo
    La visualización de datos 3D es un aspecto muy importante para varios campos de trabajo como la arquitectura, minería, videojuegos, diseño gráfico, geografía, etc. En especial en este último, la geografía, el cual a diario necesita visualizar información topográfica para hacer un estudio previo de los terrenos sin la necesidad de estar presente. En Perú, el uso información 3D por parte de los geógrafos para analizar terrenos a detalle, se ha vuelto una actividad de mucha importancia, debido a que el país es muy propenso a sufrir de fenómenos naturales como el fenómeno del Niño. Esta información topográfica suele ser de superficies de un gran tamaño que pueden llegar hasta un área de 7000 hectáreas, por lo que se necesita de procesar una inmensa cantidad de información 3D. Es por esto que el presente trabajo de investigación se centra en revisar la literatura para lograr una visualización de grandes cantidades de datos 3D. En primer lugar, se revisará cómo es que se deben guardar y organizar los datos 3D para que puedan ser fácilmente extraídos por el visualizador y qué tipo de estructura de datos es la mejor para este tipo de trabajos. En segundo lugar, se revisarán los métodos que existen actualmente para poder renderizar los datos 3D de forma fluida, con el objetivo de logar una visualización interactiva del usuario sin exigir tantos recursos. Por último, se presentarán las conclusiones de los dos puntos mencionados anteriormente y se explicarán cuáles son los mejores métodos para realizar el proyecto de visualización de grandes cantidades de datos 3D.
  • Ítem
    Reconstrucción 3d de piezas arqueológicas a partir de imágenes: una revisión de la literatura
    (Pontificia Universidad Católica del Perú, 2020-10-26) Carranza Cobeñas, Luis Alberto; Sipiran Mendoza, Iván Anselmo
    Los objetos arqueológicos son típicamente expuestos a efectos climatológicos, erosión y estrés físico, lo cual daña tanto parcialmente como de manera desigual sus superficies. Debido a estas condiciones, sus zonas fracturadas tienden a abrir paso a más interpretaciones, mayor ambigüedad y a veces vuelve imposible determinar su forma exacta para su reconstrucción. En la actualidad, existen esfuerzos para mejorar esta reconstrucción mediante el uso de herramientas computacionales, tales como métodos simétricos de reconstrucción; sin embargo, la mayoría de estos esfuerzos asumen que estos objetos hechos por el hombre guardan algún tipo de estructura y regularidad, por lo que se basan en métodos geométricos y simétricos complejos que limitan la reparación de las piezas arqueológicas.
  • Ítem
    Reconstrucción 3D usando un enfoque basado en imágenes de piezas arqueológicas incompletas: una revisión literaria
    (Pontificia Universidad Católica del Perú, 2020-09-04) Lira Palomino, Alvaro; Alfaro Alfaro, Analí Jesús; Sipiran Mendoza, Iván Anselmo
    En los últimos años se ha presentado un incremento en el interés por la conservación del patrimonio cultural. Esto incluye varias actividades, siendo una de ellas la conservación de piezas arqueológicas. Esta actividad ha tomado gran relevancia entre expertos en arqueología debido a la proliferación de piezas arqueológicas dañadas o incompletas que son encontradas. Gracias a los avances en informática, las instituciones que se desenvuelven en el sector han optado por la reconstrucción 3D de las piezas arqueológicas. Para llevar a cabo esta tarea hay una variedad de técnicas que necesitan el uso de dispositivos de alta tecnología como los escánares 3D. Por tal razón, dichas técnicas son costosas, tediosas y demandan de mano de obra calificada para realizarse. Por otro lado, se han presentado avances significativos en técnicas de reconstrucción 3D que utilizan modelos de aprendizaje profundo para efectuarla, de las cuales destacan las técnicas que utilizan una sola imagen del objeto a digitalizar. Por lo mencionado, se elabora el presente trabajo de investigación con el objetivo de hacer una revisión de la literatura acerca de los últimos intentos por la reconstrucción 3D que usan un enfoque basado en imágenes para evaluar y proponer un proyecto para el desarrollo de una herramienta que permita reconstruir modelos 3D de piezas arqueológicas a partir de imágenes de piezas arqueológicas incompletas. Asimismo, se revisarán las herramientas y métodos para la ejecución del proyecto.
  • Ítem
    Diseño de una arquitectura de aprendizaje automático que brinde soporte para la detección de mentiras mediante el análisis de video
    (Pontificia Universidad Católica del Perú, 2019-07-30) Salas Guillén, Diego Andrés; Sipiran Mendoza, Iván Anselmo
    La justicia y la búsqueda de la verdad en la investigación criminal requiere del uso de una herramienta fundamental para su éxito, el interrogatorio. En un interrogatorio, un experto hace uso de su experiencia y su juicio para, mediante el cuestionamiento del acusado, obtener una verdad explícita o implícita de parte de este sobre el hecho a investigar. El presente proyecto de investigación apunta a diseñar un modelo de aprendizaje automático que brinde soporte para la detección de mentiras en interrogatorios mediante el análisis de video. Es una contribución a los trabajos de investigación realizados por el grupo IA-PUCP (Grupo de Investigación en Inteligencia Artificial) de la Pontificia Universidad Católica del Perú. Se utilizó un conjunto de datos puesto a disponibilidad por Rada Mihalcea del grupo “Language and Information Technologies” de la Universidad de Michigan. La propuesta de arquitectura para el modelo consiste en una capa de preprocesamiento de datos que utiliza un algoritmo de reconocimiento facial para extraer los rostros del video, limitando el espacio de características. Luego, se utiliza una red convolucional preentrenada para realizar la extracción de características. Finalmente, se utiliza una red recurrente LSTM para procesar las características y luego una red neuronal para clasificar los videos. Se experimentó con cinco redes convolucionales (Resnet, InceptionV3, Xception, VGG16 y VGG19), el mejor fue InceptionV3. Este obtuvo una exactitud de 78.6 %, valor que supera varios de los resultados obtenidos por los modelos, presentados en la publicación “A Multi-View Learning Approach to Deception Detection” de N. Carissimi, que no aplicaron entrenamiento en la extracción convolucional. Esto, utilizando menos información y automatizando la extracción de la misma.
  • Ítem
    Fusión de datos para segmentación semántica en aplicaciones urbanas de teledetección aérea usando algoritmos de aprendizaje profundo
    (Pontificia Universidad Católica del Perú, 2019-06-27) Chicchón Apaza, Miguel Angel; Sipiran Mendoza, Iván Anselmo
    La creciente urbanización requiere un mapeo y monitoreo preciso del sistema urbano para planificar futuros desarrollos. La teledetección permite obtener información de la superficie de la Tierra y a partir de esta comprender el proceso de urbanización. Esta información hoy en dia puede ser obtenida en forma masiva utilizando vehículos aéreos no tripulados. Esta información puede ser variada incluyendo imágenes ópticas rgb, multiespectrales y modelos digitales de superficie, generandose la necesida de contar con técnicas de fusión multisensorial eficientes y efectivas para explotarlas completamente. La segmentación semántica en teledetección urbana permite la interpretación automática de los datos y es útil en tareas como el mapeo de la cobertura terrestre y la planificación urbana. Actualmente, el aprendizaje profundo se ha vuelto de interés en Visión por computador y Teledetección, existiendo diferentes estudios de la aplicación de variantes de redes neuronales convolucionales (CNN) en segmentación semántica. En el presente trabajo de tesis se investiga la utilización de métodos de fusión de datos basado en algoritmos de aprendizaje profundo para la segmentación semántica en aplicaciones urbanas de teledetección.
  • Ítem
    3D Reconstruction of Incomplete Archaeological Objects Using a Generative Adversarial Network
    (Pontificia Universidad Católica del Perú, 2018-07-09) Hermoza Aragonés, Renato; Sipiran Mendoza, Iván Anselmo
    We introduce a data-driven approach to aid the repairing and conservation of archaeological objects: ORGAN, an object reconstruction generative adversarial network (GAN). By using an encoder-decoder 3D deep neural network on a GAN architecture, and combining two loss objectives: a completion loss and an Improved Wasserstein GAN loss, we can train a network to effectively predict the missing geometry of damaged objects. As archaeological objects can greatly differ between them, the network is conditioned on a variable, which can be a culture, a region or any metadata of the object. In our results, we show that our method can recover most of the information from damaged objects, even in cases where more than half of the voxels are missing, without producing many errors.