Tesis y Trabajos de Investigación PUCP
URI permanente para esta comunidadhttp://54.81.141.168/handle/123456789/6
El Repositorio Digital de Tesis y Trabajos de Investigación PUCP aporta al Repositorio Institucional con todos sus registros, organizados por grado: Doctorado, Maestría, Licenciatura y Bachillerato. Se actualiza permanentemente con las nuevas tesis y trabajos de investigación sustentados y autorizados, así como también con los que que fueron sustentados años atrás.
Ingresa a su web: Repositorio Digital de Tesis y Trabajos de Investigación PUCP
Explorar
19 resultados
Resultados de búsqueda
Ítem Texto completo enlazado Diseño de un sistema automático para el cultivo vertical de hortalizas e inspección por visión artificial(Pontificia Universidad Católica del Perú, 2024-10-16) Aguilar Paredes, David Moisés; Crisóstomo Romero, Pedro MoisésLa incertidumbre en la producción de alimentos se intensifica debido a la contaminación del suelo, el cambio climático y el inminente aumento de la población a 9.8 mil millones de personas. La agricultura convencional, con su uso intensivo de químicos, ha contribuido a perder el 30% de las tierras arables a nivel mundial en las últimas cuatro décadas. Esta situación destaca la urgencia de replantear los métodos de producción para abordar la creciente demanda, preservar los recursos y garantizar la sostenibilidad a largo plazo. En respuesta a este desafío, la agricultura vertical ha surgido como una solución tecnológica que ofrece protección contra insectos y enfermedades, además de posibilitar la producción independientemente de los factores climáticos. Este estudio de investigación se propone analizar el estado actual de la agricultura vertical, diseñar un sistema que permita el cultivo e inspección a través de visión artificial, y seleccionar dicho sistema mediante criterios técnicoseconómicos y un análisis de costos. En el primer capítulo, se presenta la problemática abordada, los objetivos, la metodología, y el alcance del trabajo. Se realiza un análisis exhaustivo del estado del arte sobre las tecnologías en cultivos verticales y proyectos anteriores. En el segundo capítulo, se aborda el proyecto conceptual, destacando la elección de una solución basada en un análisis técnico-económico. Esta solución implica la propuesta de una estructura metálica para alojar niveles de cultivos, integrando sensores para monitorear los parámetros de las plantas y actuadores para la distribución de la solución nutritiva. En el tercer capítulo, se diseña y simula la estructura metálica para garantizar el cumplimiento de los requerimientos establecidos. Además, se eligen los sensores, actuadores, fuentes de energía y una cámara para el subsistema propuesto. Finalmente, se simula el algoritmo de procesamiento de imágenes, se realizan pruebas del subsistema de transporte de la cámara, se estima el costo y se presentan las conclusiones del proyecto. En resumen, esta investigación propone una solución innovadora que integra la agricultura vertical y visión artificial para abordar los desafíos de la agricultura tradicional, siendo clave para asegurar la futura seguridad alimentaria.Ítem Texto completo enlazado Segmentación semántica de escenas urbanas de la provincia de Huamanga(Pontificia Universidad Católica del Perú, 2024-09-10) Pasapera Huaman, Lui Gustavo; Flores Espinoza, Donato AndrésLa presente tesis se enfoca en la identificación y clasificación de objetos en escenas urbanas de la provincia de Huamanga, explorando un entorno diferente al de las ciudades desarrolladas y otras bases de datos existentes. Se estudiarán las escenas urbanas de Huamanga para segmentar imágenes en 7 clases de datos: personas, vehículos, motociclistas, edificios, veredas, pistas y otros, que incluyen detalles de cielo y cables de energía eléctrica. El enfoque principal de la tesis estará centrado en la visión por computadora, específicamente en la segmentación semántica para la clasificación de objetos. Para ello, se emplearán arquitecturas de aprendizaje profundo pre-entrenadas adaptadas a Deeplabv3+, y se utilizarán imágenes de la provincia de Huamanga como base de datos local. La investigación se inicia con un análisis del estado del arte, destacando la importancia de la clasificación de objetos en escenas urbanas y los beneficios del aprendizaje profundo en comparación con métodos tradicionales. Se enfatiza la necesidad de utilizar bases de datos locales sobre las existentes, así como la base teórica para la clasificación de imágenes locales utilizando Deeplabv3+ y redes de aprendizaje profundo mediante la transferencia de aprendizaje. Posteriormente, se describe el diseño, la recopilación y el enfoque de la base de datos locales en comparación con conjuntos de datos como Imagenet y CityScapes, utilizando la arquitectura Deeplabv3+ junto con redes de aprendizaje profundo en los datos locales. Finalmente, se presentan los resultados basados en el incremento del número de datos, analizando la precisión, el Índice de Jaccard (IoU) y el mBFScore tanto a nivel global como por clase, junto con un análisis comparativo con la base de datos Cityscapes. Se proporcionan tablas sumarias que verifican los resultados de cada red de aprendizaje profundo y se propone hardware para dispositivos capaces de ejecutar tareas de segmentación semántica.Ítem Texto completo enlazado Predicción de un tiro penal de fútbol basado en la estimación de postura del jugador(Pontificia Universidad Católica del Perú, 2024-06-24) Mauricio Salazar, Josue Angel; Alatrista Salas, HugoEn este artículo se presenta una metodología innovadora para predecir un tiro penal en fútbol basado en la estimación de postura del jugador que ejecuta el disparo haciendo uso de dos herramientas de visión computacional como segmentación semántica en videos y la estimación de postura 3D mediante los métodos TAM y MMPose, respectivamente. Para ello, se construyó un corpus de videos de tiros penales y se han entrenado modelos de aprendizaje profundo para predecir la región del arco a la cual llegará el disparo. Los resultados muestran que el modelo llamado CNN 3D logra una mejor precisión con respecto a los otros modelos entrenados. Además, se ha medido la influencia de distintas partes del cuerpo con respecto a la tarea de predicción, mostrando que las piernas son las partes más influyentes. Por último, implementamos una herramienta web para el entrenamiento de porteros y jugadores de fútbol en tiros penales, ofreciendo de esta manera posibles mejoras en las tácticas de un disparo de tiro penal mediante el uso de la visión computacional.Ítem Texto completo enlazado Advances in artificial intelligence applied to ultrasound imaging(Pontificia Universidad Católica del Perú, 2024-05-28) Romero Gutierrez, Stefano Enrique; Castañeda Aphan, BenjaminUltrasound imaging in rural areas often faces challenges due to the scarcity of skilled radiologists or sonographers. This research explores enhancing ultrasound imaging focused in resource-scarce settings via external anatomical landmarks for asynchronous ultrasound acquisition using artificial intelligence (AI) and computer vision algorithms based on the nature of the acquisition. First, it addresses lung ultrasound health status by generating one single image by sweeping the transducer in a sagittal position along the chest. The validation was performed using normal and abnormal cases. Second, a multi-camera system for ultrasound probe tracking with AI is proposed. The results were evaluated by quantitative measurements of speeds, angles, and simulation of lung VSI protocol. Third, a 3D segmentation of breast tumors using ultrasound videos acquired by asynchronous protocols was realized. A representative frame of the videos is extracted to analyze the nature and determine if is a benign or malignant case. Fourth, a set of obstetric data acquired by asynchronous protocols for the assessment of fetal head presentation and placenta position was realized. Fetal biometry such as head circumference and biparietal diameter were calculated and compared with physician measurements. Finally, an elastography approach was tested for plantar soft tissue assessment by a test-retest experiment for biomechanical characterization. An automatic calcaneus segmentation was employed in the B-mode as an aid in the visualization and for an immediate region of interest selection. The results were compared with the manual selection of the region of interest and the respective calcaneus segmentation. The findings of this work demonstrate a substantial advancement in the field of ultrasound imaging, especially tailored for resource-limited settings.Ítem Desconocido Sistema de adquisición de imágenes submarinas para la generación de tours virtuales(Pontificia Universidad Católica del Perú, 2024-04-10) Mendoza Rabanal, Renzo Martin; Arce Cigüeñas, Diego MartinEl desarrollo del turismo en los ambientes submarinos es una actividad con alto potencial gracias a las características de estos entornos, ideales para el desarrollo de este sector. No obstante, el desarrollo actividades en los entornos submarinos pueden causar consecuencias irreparables, como el aumento de la contaminación y agobio de las especies submarinas debido a la fragilidad de los ecosistemas presentes. Una solución para promover el ecoturismo es el uso de los recorridos virtuales construidos a partir de información obtenida de estos entornos. Para ello, se requieren sistemas destinados a la adquisición de estos datos, los cuales se pueden encontrar en el mercado, pero presentan diseños rígidos y son de alto costo. Debido a ello, se plantea el desarrollo de una tecnología de bajo costo que permita la adquisición de los datos necesarios para la reconstrucción virtual de los ambientes submarinos y permita su uso por una buzo o un vehículo submarino. El presente trabajo de tesis forma parte del proyecto Concytec 161-2020 - Sistema de Fotogrametría Submarina y Visión por Computadora Avanzado para generación de videos 360° y modelos virtuales digitales de sectores submarinos con potencial turístico en el Perú. El documento desarrolla el diseño de un sistema de adquisición de imágenes submarinas de tres cámaras para obtener información de los ambientes de interés para la generación de recorridos virtuales hasta una profundidad máxima de 750 m. Este sistema es capaz de estimar su desplazamiento relativo y obtener su orientación para generar imágenes georreferenciadas y reducir el tiempo de generación de los ambientes virtuales. Este sistema cuenta con dos configuraciones para ser usado por un buzo profesional (hasta una profundidad mínima de 60 m) o un ROV submarino, lo cual destaca ante los sistemas comerciales enfocados únicamente a uno de estos modos de uso. El trabajo consta del diseño de tres dominios principales. (i) El sistema mecánico se compone de una estructura de soporte conformada por perfiles estructurales y cuatro contendores cilíndricos que contienen a los elementos electrónicos. (ii) El sistema electrónico cuenta con circuitos diseñados para el sensado del voltaje de batería y protección ante ingreso de agua, realizando simulaciones para verificar su funcionamiento. A su vez, se realizó la selección de los componentes electrónicos y fuente de alimentación. En el desarrollo de (iii) la etapa de control, se realizó el diseño de la interfaz y se propuso una estrategia de control de iluminación adaptativo basada en la diferencia de luminosidad entre la imagen sensada y la imagen con iluminación óptima; esta última es obtenida al aplicar una ecualización de histograma a la imagen original. Por otra parte, se simuló un algoritmo de estimación de desplazamiento basado en el filtro de Kalman, el cual mostró una desviación significante entre el valor real y estimado de desplazamiento. Para comprobar el funcionamiento del sistema, se implementó un prototipo enfocado únicamente a su modo de uso por buzo. Las pruebas realizadas demuestran que el sistema es capaz de aislar los componentes eléctricos y electrónicos ante el entorno acuático. Por otra parte, se comprobó que el tiempo de operación del prototipo es mayor a 120 minutos. Finalmente, se realizaron pruebas del control de iluminación donde se concluyó que la iluminación óptima es tal que el error generado no cambia al aumentar la intensidad de luz que proveen las luces submarinas.Ítem Texto completo enlazado Evaluación de modelos de segmentación semántica para el monitoreo de deslizamiento de tierra utilizando imágenes satelitales(Pontificia Universidad Católica del Perú, 2024-04-03) Yali Samaniego, Roy Marco; Fonseca Arroyo, Pablo AlejandroEn el ámbito del aprendizaje automático, un desafío persistente es la disponibilidad de datos suficientes, especialmente en tareas de visión por computadora. Este desafío se amplifica cuando se trabaja con sensores remotos, donde las bases de datos etiquetadas para abordar problemas son escasas. Este manuscrito examina críticamente el monitoreo de deslizamientos de tierra en el paisaje peruano y presenta tres contribuciones en esta dirección. La primera contribución expande un conjunto de datos de imágenes satelital es sobre deslizamientos de tierra (Landslide4Sense) proveniente de territorios asiáticos, con 3799 imágenes debidamente etiquetadas. Reconociendo la dinámica geoespacial de Perú, se incrementó este conjunto de datos con 838 escenarios locales. Estas adiciones mantienen congruencia con el conjunto de datos original en términos de atributos y configuración, asegurando replicabilidad y escalabilidad para futuras investigaciones. La segunda evalúa varios modelos de segmentación semántica basados en la arquitectura U-net, reforzada por la función de pérdida de Entropía Cruzada Ponderada + Dice Loss, óptima en tareas de segmentación con conjuntos de datos desequilibrados. Los resultados permiten alcanzar un F1-Score del 75.5% con la arquitectura U-net (vanilla) superando el benchmark de referencia del 71.65%. La última contribución muestra un desarrollado integral para la adquisición de datos, procesamiento y entrenamiento/evaluación de modelos. Dado que este marco tiene el potencial de impulsar una aplicabilidad general de sistemas de segmentación a sistemas de monitoreo de deslizamientos de tierra, y detener un alcance más amplio a la comunidad académica y partes interesadas gubernamentales en Latinoamérica y en todo el mundo.Ítem Texto completo enlazado Estimación del carbono almacenado en paisajes agropecuarios y ganaderos a partir de Imágenes multiespectrales capturadas por drones, y técnicas de aprendizaje profundo(Pontificia Universidad Católica del Perú, 2024-01-10) Tovar Galarreta, Juan Carlos Alfredo; Villanueva Talavera, Edwin RafaelLos paisajes agrícolas y ganaderos están estrechamente relacionados con el flujo de carbono, ya que actúan como reservorios de carbono en forma de biomasa. La evaluación de las reservas de carbono almacenadas en estas zonas es importante para apoyar la toma de decisiones que impidan que estas zonas se conviertan en fuentes de emisión de carbono. Sin embargo, las técnicas tradicionales de estimación de las reservas de carbono requieren un muestreo in situ, lo que supone una tarea extenuante, arriesgada, costosa DE escasa cobertura. En este estudio, proponemos una metodología, basada en imágenes multiespectrales capturadas por drones y modelos de aprendizaje profundo, para automatizar la tarea de estimar mapas de reservas de carbono almacenados en paisajes agrícolas y ganaderos. Aplicamos una arquitectura de red neuronal U-Net para discriminar las zonas arbóreas y pastizales. Luego, se desarrolla un modelo basado en redes neuronales convolucionales para la estimación de la densidad de carbono a partir de imágenes multiespectrales. Resultados experimentales en paisajes agrícolas y ganaderos de la Amazonía peruana mostraron la efectividad de la metodología propuesta, reportando un mIoU de 87%, un RMSE de 2.44 para zonas arbóreas, y un RMSE de 1.84 para zonas de pastura. Concluimos que la estimación de la densidad de carbono es alcanzable con el enfoque propuesto. Esta metodología puede ser útil para la toma de decisiones y puede contribuir a la gestión o al control del cambio climático.Ítem Texto completo enlazado Diseño de una máquina clasificadora de truchas en piscigranjas aplicando visión por computadora(Pontificia Universidad Católica del Perú, 2023-03-09) Vega de la Cruz, Luis Enrique; García Zevallos, Luis EnriqueEn los últimos años la producción de truchas en el Perú ha ido creciendo significativamente contribuyendo al sector exportación, al aumento del PBI y a una mayor empleabilidad en el sector rural. Esta actividad incluye procedimientos y técnicas para la crianza de las truchas durante todo su ciclo de vida, teniendo como una de las principales tareas la clasificación por tamaño, facilitando la supervivencia de las truchas más pequeñas. En el mercado internacional, existen máquinas automáticas de clasificación de peces por tamaño. Sin embargo, su alto costo obliga al productor peruano a mantener sus procedimientos de forma manual, lo que significa el empleo de recurso humano especializado. Por ello, se hace viable la propuesta de una máquina clasificadora de truchas por tamaño cuyo costo sea accesible al piscicultor local. La presente investigación tiene como objetivo el diseño de una máquina clasificadora de truchas por tamaño aplicando visión por computadora. Para ello, se utiliza la metodología alemana VDI 2206, mediante la cual se realiza una investigación en el proceso de crianza de truchas y las tecnologías existentes actualmente en la clasificación por tamaño. Sobre la base de lo anterior, se define una lista de requerimientos que delimita el diseño y se dispone algunas posibles soluciones mediante un análisis de cada función realizada por la máquina. Luego, se realizan cálculos y diseños preliminares que sustenten la elección de la solución óptima de acuerdo a las exigencias mencionadas anteriormente. Posteriormente, se elabora el diseño óptimo que incluye simulaciones y pruebas de visión por computadora que valide el diseño propuesto. Finalmente, se logra diseñar una máquina que clasifica truchas por tamaño aplicando visión por computadora, la cual selecciona tres tipos de tamaño (juvenil, engorde y reproductor) y cuenta con una capacidad de selección de 1920 truchas / hora.Ítem Texto completo enlazado Desarrollo de una aplicación de visión artificial para escanear objetos 3D con cámaras de fotos(Pontificia Universidad Católica del Perú, 2022-03-15) Sumoso Vicuña, Ernie Ludwick; Sipiran Mendoza, Iván AnselmoLos métodos tradicionales de escaneo 3D requieren de un contacto físico directo con los objetos a escanear. En algunos casos demandan incluso la rotación y movimiento constante de estos, lo cual representa un riesgo para objetos frágiles como las piezas arqueológicas. Si ignoramos este factor de riesgo podemos causar daños irreparables y frustrar el proceso de documentación de estas. Por otro lado, existen técnicas de escaneo 3D sin contacto - pasivas que no requieren de una interacción directa con los objetos. Es por ello que se propone desarrollar un software que permita escanear piezas arqueológicas usando las técnicas de reconstrucción tridimensional mediante conceptos de visión artificial, aprendizaje de máquina, data augmentation y mallas poligonales. Para lograr nuestro cometido se parte de un set inicial de 962 huacos peruanos pre escaneados proporcionados por el grupo de Inteligencia Artificial PUCP. Con este conjunto de datos se genera una extenso volumen de imágenes los cuales son procesados y utilizados para el entrenamiento de un modelo de aprendizaje de máquina. Segundo, al obtener unos primeros resultados se propone llevar a cabo la técnica de data augmentation para extender nuestra data disponible, normalizarla, segmentarla y con ello entrenar múltiples modelos bajo 2 experimentos definidos. Todo ello nos permite mejorar los resultados de reconstrucción de objetos 3D considerando la alta variabilidad de huacos peruanos. Finalmente se implementa una interfaz gráfica la cual permite al usuario interactuar con el proyecto desarrollado. En conclusión, se logra desarrollar una herramienta de software que nos permite cargar videograbaciones reales de piezas arqueológicas (bajo ciertos parámetros establecidos), procesar los archivos, visualizar y descargar los resultados obtenidos como mallas poligonales (reconstrucciones 3D almacenados en el computador).Ítem Texto completo enlazado Desarrollo de un aplicativo movil para la extracción automática de información del documento de indentificación mediante visión computacional(Pontificia Universidad Católica del Perú, 2020-07-02) Carrillo Fuertes, Tomas Ivan; Beltrán Castañón, César ArmandoLos seres humanos han tenido varias formas de identificar individuos y grupos, pero los orígenes del sistema de identificación nacional contemporáneo se remontan a 1938, cuando los legisladores en el Reino Unido aprobaron la Ley de Registro Nacional, que exigía que todos los residentes posean tarjetas de identidad. Posteriormente, Alemania, Francia, Polonia, Grecia, entre otros, también instituyeron sistemas de tarjeta de identidad (ID) después del final de la Segunda Guerra Mundial. En Perú, el Documento Nacional de Identidad (DNI) constituye la única cédula de identidad personal reconocida por el Estado para todos los actos civiles, comerciales, administrativos, judiciales y, en general, para todos aquellos casos en que, por mandato legal, deba ser presentado. Su emisión se encuentra a cargo del Registro Nacional de Identificación y Estado Civil - RENIEC. Así, la presentación del DNI implica sobre todo verificar la información que se encuentra en ella, para certificar que pertenece al portador. Para empresas como de seguros, bancos, clínicas, entre otros; es importante realizar esta tarea de verificación de forma rápida y precisa, pero por lo general esta tarea es realizada de forma manual mediante el uso de la aplicación que facilita la RENIEC, pero la cual requiere una autorización además que posee un costo por consulta1. También existen diversos aplicativos OCR para leer información de las personas a partir de tarjetas de presentación, pasaporte y documentos de identidad, sin embargo, estas herramientas son tecnologías cerradas y propietarias, cuyos costos se hacen elevados en el tiempo. Por ello, el presente trabajo busca desarrollar un modelo algorítmico que permita extraer la información de una persona a partir de la imagen de su DNI electrónico. Para conseguir este objetivo, el aplicativo utiliza algoritmos de procesamiento de imagen para identificar los datos de la persona en el DNI, luego separa cada dato de la persona en palabras y por último cada palabra en letras. Cada imagen que contiene una letra será clasificada por un modelo para identificar que letra es. En este trabajo para la clasificación de letras se probó los modelos de Adaboost, basado en árboles de decisiones y YOLO (v3 tiny), que es una arquitectura neuronal inspirada en GoogLeNet. Tomando una muestra de 17 DNI electrónicos se obtuvo como resultado el 87% de letras correctamente detectadas con Adaboost y 98% con YOLO. En base a este resultado se concluye que los modelos Adaboost y YOLO pueden mejorar la extracción de la información de una persona a partir de la imagen de su DNI electrónico.