Tesis y Trabajos de Investigación PUCP

URI permanente para esta comunidadhttp://54.81.141.168/handle/123456789/6

El Repositorio Digital de Tesis y Trabajos de Investigación PUCP aporta al Repositorio Institucional con todos sus registros, organizados por grado: Doctorado, Maestría, Licenciatura y Bachillerato. Se actualiza permanentemente con las nuevas tesis y trabajos de investigación sustentados y autorizados, así como también con los que que fueron sustentados años atrás.
Ingresa a su web: Repositorio Digital de Tesis y Trabajos de Investigación PUCP

Explorar

Resultados de búsqueda

Mostrando 1 - 10 de 92
  • Ítem
    Detección y conteo de bayas en cultivo de uva de mesa Thompson Seedless mediante procesamiento digital de imágenes
    (Pontificia Universidad Católica del Perú, 2024-10-24) Perez Gutierrez, Angel de Jesus; Flores Espinoza, Donato Andrés
    Actualmente en nuestro país, los productores de cultivo de uva de mesa tienen un acceso limitado de información sobre la cantidad de la cosecha en su campo. El proceso de conteo de uvas de mesa se realiza manualmente en la cosecha, cada temporada, para poder estimar la cantidad de embalaje necesario. Este procedimiento puede variar de año en año y puede demandar de varias semanas para zonas con grandes cantidades de hectáreas de cultivo de uva de mesa. Mientras que el enfoque podría funcionar bien para los campos de tamaño pequeño, se vuelve intratable económicamente para los campos más grandes debido a la naturaleza dependiente de trabajo de la obra. En esta tesis se empleará técnicas de procesamiento digital de imágenes para mejorar la precisión del conteo de uva de mesa en el campo y reducir abruptamente el tiempo de cosecha y pérdidas económicas del exceso de embalaje. En el primer capítulo se hace referencia al estado de la investigación con respecto al cultivo de uva de mesa en nuestro país y en el extranjero, así como la declaración de la problemática y objetivos planteados. El segundo capítulo se describe el estado del arte, la matemática empleada para la programación de dos métodos que se utilizan para el conteo de bayas con su respectivo análisis comparativo. En el tercer capítulo se desarrolla dos algoritmos que permita contar las bayas en el cultivo de uva de mesa Thompson Seedless, tomando muestras de bayas de diferentes tamaños. Finalmente, en el capítulo 4 se desarrolla el análisis correspondiente y las conclusiones comparando resultados.
  • Ítem
    Diseño de un sistema automático para el cultivo vertical de hortalizas e inspección por visión artificial
    (Pontificia Universidad Católica del Perú, 2024-10-16) Aguilar Paredes, David Moisés; Crisóstomo Romero, Pedro Moisés
    La incertidumbre en la producción de alimentos se intensifica debido a la contaminación del suelo, el cambio climático y el inminente aumento de la población a 9.8 mil millones de personas. La agricultura convencional, con su uso intensivo de químicos, ha contribuido a perder el 30% de las tierras arables a nivel mundial en las últimas cuatro décadas. Esta situación destaca la urgencia de replantear los métodos de producción para abordar la creciente demanda, preservar los recursos y garantizar la sostenibilidad a largo plazo. En respuesta a este desafío, la agricultura vertical ha surgido como una solución tecnológica que ofrece protección contra insectos y enfermedades, además de posibilitar la producción independientemente de los factores climáticos. Este estudio de investigación se propone analizar el estado actual de la agricultura vertical, diseñar un sistema que permita el cultivo e inspección a través de visión artificial, y seleccionar dicho sistema mediante criterios técnicoseconómicos y un análisis de costos. En el primer capítulo, se presenta la problemática abordada, los objetivos, la metodología, y el alcance del trabajo. Se realiza un análisis exhaustivo del estado del arte sobre las tecnologías en cultivos verticales y proyectos anteriores. En el segundo capítulo, se aborda el proyecto conceptual, destacando la elección de una solución basada en un análisis técnico-económico. Esta solución implica la propuesta de una estructura metálica para alojar niveles de cultivos, integrando sensores para monitorear los parámetros de las plantas y actuadores para la distribución de la solución nutritiva. En el tercer capítulo, se diseña y simula la estructura metálica para garantizar el cumplimiento de los requerimientos establecidos. Además, se eligen los sensores, actuadores, fuentes de energía y una cámara para el subsistema propuesto. Finalmente, se simula el algoritmo de procesamiento de imágenes, se realizan pruebas del subsistema de transporte de la cámara, se estima el costo y se presentan las conclusiones del proyecto. En resumen, esta investigación propone una solución innovadora que integra la agricultura vertical y visión artificial para abordar los desafíos de la agricultura tradicional, siendo clave para asegurar la futura seguridad alimentaria.
  • Ítem
    Implementación del mamógrafo Seno Crystal Nova para mejorar la detección temprana del cáncer de mama mediante optimización eléctrica en la Clínica Wisar Salud
    (Pontificia Universidad Católica del Perú, 2024-09-20) Quispe Zambrano, Carlos Alfredo; Vilcahuaman Cajacuri, Luis
    El presente trabajo aborda y desarrolla los requerimientos que implica la importación, preinstalación, instalación y puesta en marcha del Mamógrafo Seno Crystal Nova de la marca General Electric. En tal sentido, se analizarán las características esenciales del equipo como son los parámetros eléctricos, de potencia, de comunicación, estándares internacionales a seguir, para de esta manera contar con una adecuada elección de los métodos de protección y respaldo, aisladores eléctricos, calibre de los conectores, conexiones de red, lo cual implica el enlace de comunicación con el servidor de imágenes – DICOM y enlace entre la estación de control y el estativo. Por último, se busca cumplir con los requisitos ambientales y estructurales para un correcto funcionamiento del Equipo Médico y protección contra Rayos X para los pacientes y operador.
  • Ítem
    Segmentación semántica de escenas urbanas de la provincia de Huamanga
    (Pontificia Universidad Católica del Perú, 2024-09-10) Pasapera Huaman, Lui Gustavo; Flores Espinoza, Donato Andrés
    La presente tesis se enfoca en la identificación y clasificación de objetos en escenas urbanas de la provincia de Huamanga, explorando un entorno diferente al de las ciudades desarrolladas y otras bases de datos existentes. Se estudiarán las escenas urbanas de Huamanga para segmentar imágenes en 7 clases de datos: personas, vehículos, motociclistas, edificios, veredas, pistas y otros, que incluyen detalles de cielo y cables de energía eléctrica. El enfoque principal de la tesis estará centrado en la visión por computadora, específicamente en la segmentación semántica para la clasificación de objetos. Para ello, se emplearán arquitecturas de aprendizaje profundo pre-entrenadas adaptadas a Deeplabv3+, y se utilizarán imágenes de la provincia de Huamanga como base de datos local. La investigación se inicia con un análisis del estado del arte, destacando la importancia de la clasificación de objetos en escenas urbanas y los beneficios del aprendizaje profundo en comparación con métodos tradicionales. Se enfatiza la necesidad de utilizar bases de datos locales sobre las existentes, así como la base teórica para la clasificación de imágenes locales utilizando Deeplabv3+ y redes de aprendizaje profundo mediante la transferencia de aprendizaje. Posteriormente, se describe el diseño, la recopilación y el enfoque de la base de datos locales en comparación con conjuntos de datos como Imagenet y CityScapes, utilizando la arquitectura Deeplabv3+ junto con redes de aprendizaje profundo en los datos locales. Finalmente, se presentan los resultados basados en el incremento del número de datos, analizando la precisión, el Índice de Jaccard (IoU) y el mBFScore tanto a nivel global como por clase, junto con un análisis comparativo con la base de datos Cityscapes. Se proporcionan tablas sumarias que verifican los resultados de cada red de aprendizaje profundo y se propone hardware para dispositivos capaces de ejecutar tareas de segmentación semántica.
  • Ítem
    Evaluación de método para la detección automática de puntos de referencia (landmark detection) en imágenes en dos dimensiones de huellas plantares para el diseño de una plantilla ortopédica
    (Pontificia Universidad Católica del Perú, 2024-08-28) Donayre Gamboa, Gustavo Miguel; Fonseca Arroyo, Pablo Alejandro
    El presente trabajo de investigación evalúa la técnica de regresión de mapas de calor (heatmap regression - HR) para la detección automática de puntos de referencia (landmark detection) en imágenes médicas, específicamente en las imágenes de huellas plantares en dos dimensiones. El estudio se basa en la regresión de mapas de calor con aprendizaje profundo, una técnica que ha demostrado ser efectiva en la detección de puntos en rostros y en la estimación de la pose humana. Se propone un método automático para la detección de 8 puntos en las imágenes digitalizadas de huellas plantares que servirán de referencia para el diseño base de una plantilla ortopédica bidimensional, buscando así mejorar el proceso de fabricación de plantillas ortopédicas, que actualmente se realiza de forma manual y artesanal en la mayoría de los países de América Latina. La detección automática de estos puntos de referencia en las huellas plantares tiene el potencial de agilizar este proceso y mejorar la precisión de las plantillas. Los resultados del estudio mostraron un error absoluto promedio normalizado de 0.01017 en el conjunto de validación. Estas evaluaciones se llevaron a cabo utilizando una red convolucional U-Net, la cual consta de una ruta de codificación y compresión de imágenes para capturar el contexto, y una ruta de expansión simétrica que permite una localización precisa de puntos de interés en un tiempo razonable gracias al uso de los procesadores GPU actuales.
  • Ítem
    Predicción de un tiro penal de fútbol basado en la estimación de postura del jugador
    (Pontificia Universidad Católica del Perú, 2024-06-24) Mauricio Salazar, Josue Angel; Alatrista Salas, Hugo
    En este artículo se presenta una metodología innovadora para predecir un tiro penal en fútbol basado en la estimación de postura del jugador que ejecuta el disparo haciendo uso de dos herramientas de visión computacional como segmentación semántica en videos y la estimación de postura 3D mediante los métodos TAM y MMPose, respectivamente. Para ello, se construyó un corpus de videos de tiros penales y se han entrenado modelos de aprendizaje profundo para predecir la región del arco a la cual llegará el disparo. Los resultados muestran que el modelo llamado CNN 3D logra una mejor precisión con respecto a los otros modelos entrenados. Además, se ha medido la influencia de distintas partes del cuerpo con respecto a la tarea de predicción, mostrando que las piernas son las partes más influyentes. Por último, implementamos una herramienta web para el entrenamiento de porteros y jugadores de fútbol en tiros penales, ofreciendo de esta manera posibles mejoras en las tácticas de un disparo de tiro penal mediante el uso de la visión computacional.
  • Ítem
    Clasificación automática de eventos en videos de fútbol utilizando redes convolucionales profundas
    (Pontificia Universidad Católica del Perú, 2024-06-21) Laboriano Galindo, Alipio; Beltrán Castañón, César Armando
    La forma en que las nuevas generaciones consumen y experimentan el deporte especialmente el fútbol, ha generado oportunidades significativas en la difusión de contenidos deportivos en plataformas no tradicionales y en formatos más reducidos. Sin embargo, recuperar información con contenido semántico de eventos deportivos presentados en formato de video no es tarea sencilla y plantea diversos retos. En videos de partidos de fútbol entre otros retos tenemos: las posiciones de las cámaras de grabación, la superposición de eventos o jugadas y la ingente cantidad de fotogramas disponibles. Para generar resúmenes de calidad y que sean interesantes para el aficionado, en esta investigación se desarrolló un sistema basado en Redes Convolucionales Profundas para clasificar automáticamente eventos o jugadas que ocurren durante un partido de fútbol. Para ello se construyó una base de datos a partir de videos de fútbol descargados de SoccerNet, la cual contiene 1,959 videoclips de 5 eventos: saques de meta, tiros de esquina, faltas cometidas, tiros libres indirectos y remates al arco. Para la experimentación se utilizó técnicas de preprocesamiento de video, una arquitectura convolucional propia y se aplicó transfer learning con modelos como ResNet50, EfficientNetb0, Visión Transformers y Video Visión Transformers. El mejor resultado se obtuvo con una EfficentNetb0 modificada en su primera capa convolucional, con la cual se obtuvo un 91% accuracy, y una precisión de 100% para los saques de meta, 92% para los tiros de esquina, 90% para las faltas cometidas, 88% para los tiros libres indirectos y 89% para los remates al arco.
  • Ítem
    Optimal vicinity 2D median filter for fixed-point or floating-point values
    (Pontificia Universidad Católica del Perú, 2024-06-19) Chang Fu, Javier; Carranza De La Cruz, Cesar Alberto
    Los filtros medianos son una técnica digital no lineal normalmente usada para remover ruido blanco, ’sal y pimienta’ de imágenes digitales. Consiste en reemplazar el valor de cada pixel por la mediana de los valores circundantes. Las implementaciones en punto flotante usan ordenamientos con técnicas de comparación para encontrar la mediana. Un método trivial de ordenar n elementos tiene una complejidad de O(n2), y los ordenamientos más rápidos tienen complejidad de O(n log n) al calcular la mediana de n elementos. Sin embargo, éstos algoritmos suelen tener fuerte divergencia en su ejecución. Otras implementaciones usan algoritmos basados en histogramas, y obtienen sus mejores desempeños cuando operan con filtros de ventanas grandes. Estos algoritmos pueden alcanzar tiempo constante al evaluar filtros medianos, es decir, presenta una complejidad de O(1). El presente trabajo propone un algoritmo de filtro mediano rápido y altamente paralelizable. Se basa en ordenamientos sin divergencia con ejecución O(n log2 n) y mezclas O(n) con los cuales se puede calcular grupos de pixeles en paralelo. Este método se beneficia de la redundancia de valores en pixeles próximos y encuentra la vecindad de procesamiento óptima que minimiza el número de operaciones promedio por pixel. El presente trabajo (i) puede procesar indiferentemente imágenes en punto fijo o flotante, (ii) aprovecha al máximo el paralelismo de múltiples arquitecturas, (iii) ha sido implementado en CPU y GPU, (iv) se logra una aceleración respecto al estado del arte.
  • Ítem
    Modelo para la segmentación y análisis de gravedad de áreas afectadas por incendios forestales usando redes neuronales convolucionales e imágenes satelitales
    (Pontificia Universidad Católica del Perú, 2024-06-11) Lazo La Rosa, Leandro; Beltrán Castañón, Cesar Armando; Pineda Ancco, Ferdinand Edgardo
    La frecuencia de los incendios forestales ha ido en aumento, debido a actividades humanas y por el aumento del calentamiento global. En consecuencia, el proyecto de tesis tiene como objetivo, el desarrollo de un modelo de red neuronal que se puede integrar al análisis de la magnitud y extensión de los daños, además de apoyar en la planificación de los planes de recuperación del área afectada. Para ello, se realiza una segmentación y análisis de áreas afectadas por incendios forestales en imágenes satelitales usando redes neuronales convolucionales. En un principio, obtenemos un historial de incendios forestales en suelo peruano consultando la página de monitoreo de incendios forestales de SERFOR. Luego, las imágenes satelitales capturadas por el satélite Sentinel 2 se obtienen del repositorio de la agencia espacial europea. Finalmente, debido al gran tamaño de las imágenes obtenidas, estas se fraccionan en imágenes de 512 x 512 píxeles, donde posteriormente, se realiza un etiquetado manual del área afectada por el incendio forestal. Por otro lado, el modelo de red neuronal usa dos conjuntos de datos de imágenes 512 x 512 píxeles, capturadas por los satélites LandSat 8 y Sentinel 2. Inicialmente se trabaja con el conjunto de imágenes de LandSat 8 que ya cuentan con una etiqueta del área afectada. Una vez se obtiene el modelo inicial para la segmentación de la cicatriz del incendio. Se realiza un entrenamiento usando las imágenes de Sentinel 2. Para comprobar el correcto funcionamiento, se implementa una interfaz gráfica que ayuda a mostrar las máscaras de segmentación sobreponiéndose con la imagen original. Adicionalmente, se muestran colores calculados con el índice de calcinación normalizado para mostrar la gravedad del incendio forestal.
  • Ítem
    Generación de imágenes de acciones específicas de una persona utilizando aprendizaje profundo
    (Pontificia Universidad Católica del Perú, 2024-04-16) Morales Pariona, Jose Ulises; Beltran Castañon, Cesar Armando
    Desde que aparecieron las redes GAN, se han realizado varias investigaciones sobre cómo generar imágenes en diversos ámbitos, como la generación de imágenes, conversión de imágenes, síntesis de videos, síntesis de imágenes a partir de textos y predicción de cuadros de videos. Basándose mayormente en mejorar la generación de imágenes de alta resolución y la reconstrucción o predicción de datos. El propósito de este trabajo es implementar las redes GAN en otros ámbitos, como la generación de imágenes de entidades realizando una acción. En este caso se consideró 3 acciones de personas, que son los ejercicios de Glúteo, Abdomen y Cardio. En primer lugar, se descargaron y procesaron las imágenes de YouTube, el cual incluye una secuencia de imágenes de cada acción. Posteriormente, se separó dos grupos de imágenes, de una sola persona, y de personas diferentes realizando las acciones. En segundo lugar, se seleccionó el modelo InfoGAN para la generación de imágenes, teniendo como evaluador de rendimiento, la Puntuación Inicial (PI). Obteniendo como resultados para el primer grupo, una puntuación máxima de 1.28 y en el segundo grupo, una puntuación máxima de 1.3. En conclusión, aunque no se obtuvo el puntaje máximo de 3 para este evaluador de rendimiento, debido a la cantidad y calidad de las imágenes. Se aprecia, que el modelo si logra diferenciar los 3 tipos de ejercicios, aunque existen casos donde se muestran incorrectamente las piernas, los brazos y la cabeza.