Tesis y Trabajos de Investigación PUCP

URI permanente para esta comunidadhttp://54.81.141.168/handle/123456789/6

El Repositorio Digital de Tesis y Trabajos de Investigación PUCP aporta al Repositorio Institucional con todos sus registros, organizados por grado: Doctorado, Maestría, Licenciatura y Bachillerato. Se actualiza permanentemente con las nuevas tesis y trabajos de investigación sustentados y autorizados, así como también con los que que fueron sustentados años atrás.
Ingresa a su web: Repositorio Digital de Tesis y Trabajos de Investigación PUCP

Explorar

Resultados de búsqueda

Mostrando 1 - 7 de 7

Texto completo enlazado
Clasificación automática de eventos en videos de fútbol utilizando redes convolucionales profundas
(Pontificia Universidad Católica del Perú, 2024-06-21) Laboriano Galindo, Alipio; Beltrán Castañón, César Armando
La forma en que las nuevas generaciones consumen y experimentan el deporte especialmente el fútbol, ha generado oportunidades significativas en la difusión de contenidos deportivos en plataformas no tradicionales y en formatos más reducidos. Sin embargo, recuperar información con contenido semántico de eventos deportivos presentados en formato de video no es tarea sencilla y plantea diversos retos. En videos de partidos de fútbol entre otros retos tenemos: las posiciones de las cámaras de grabación, la superposición de eventos o jugadas y la ingente cantidad de fotogramas disponibles. Para generar resúmenes de calidad y que sean interesantes para el aficionado, en esta investigación se desarrolló un sistema basado en Redes Convolucionales Profundas para clasificar automáticamente eventos o jugadas que ocurren durante un partido de fútbol. Para ello se construyó una base de datos a partir de videos de fútbol descargados de SoccerNet, la cual contiene 1,959 videoclips de 5 eventos: saques de meta, tiros de esquina, faltas cometidas, tiros libres indirectos y remates al arco. Para la experimentación se utilizó técnicas de preprocesamiento de video, una arquitectura convolucional propia y se aplicó transfer learning con modelos como ResNet50, EfficientNetb0, Visión Transformers y Video Visión Transformers. El mejor resultado se obtuvo con una EfficentNetb0 modificada en su primera capa convolucional, con la cual se obtuvo un 91% accuracy, y una precisión de 100% para los saques de meta, 92% para los tiros de esquina, 90% para las faltas cometidas, 88% para los tiros libres indirectos y 89% para los remates al arco.
Texto completo enlazado
Determinación y segmentación del nivel socio-económico a partir del análisis automático de imágenes de satélite
(Pontificia Universidad Católica del Perú, 2022-07-11) Sosa Pezo, Carlos Alberto; Beltrán Castañón, César Armando
Este proyecto tiene como objetivo desarrollar un modelo de análisis de imágenes satelitales basado en redes neuronales profundas para poder identificar de forma automática el nivel socioeconómico de zonas urbanas, a través de la utilización de las imágenes obtenidas mediante el satélite estatal peruano PerúSat-1, las cuales fueron provistas al proyecto por la Comisión Nacional de Investigación y Desarrollo Aeroespacial (CONIDA). De esta manera, se buscó proveer una fuente alternativa y complementaria a los métodos manuales de recolección de datos demográficos para los casos en los que esta metodología tradicional no resulta conveniente de ejecutar por factores de tiempo y presupuesto. Para ello, el proyecto inicia con la conformación del corpus de datos utilizados para el entrenamiento del modelo de análisis de imágenes satelitales. Este conjunto de datos incorpora, además de imágenes satelitales de PerúSat-1 de la ciudad de Lima capturadas entre 2016 y 2020, una serie de etiquetas que indican el nivel de ingresos de cada manzana en dicha ciudad. Estas etiquetas son el resultado de un estudio elaborado por el Instituto Nacional de Estadística e Informática en el año 2019, tomando como base los datos obtenidos durante el Censo Nacional de Población y Vivienda de 2017. En el caso de las imágenes satelitales, este proceso consiste en la composición en imágenes de cuatro bandas (rojo, azul, verde e infrarrojo) de alta resolución y su posterior división en bloques cuadrados de 512 píxeles en cada dimensión; mientras que las etiquetas censales son organizadas en una base de datos relacional, de forma que puedan ser accedidas por el script para la integración de ambas fuentes de datos. Finalmente, se asigna a cada bloque de 512 x 512 píxeles una máscara con las etiquetas censales correspondientes a la zona capturada. Luego, se define un protocolo de preprocesamiento de los datos, en el que normalizan los parches de las imágenes satelitales, además de incrementar el tamaño del conjunto de datos, de modo que sean adecuados para el entrenamiento de los modelos desarrollados. Respecto a estos, se dispone de dos modelos de redes neuronales convolucionales para el análisis socioeconómico de las imágenes satelitales: el primero, encargado de segmentar semánticamente los techos observados en las imágenes; y el segundo que, recibiendo como entradas la imágen satelital original y la máscara de techos generada por el modelo anterior, detecta el nivel socioeconómico de cada manzana en dicha imagen. Así, se obtiene como resultado final una máscara de bits en la que se indica el nivel socioeconómico de cada manzana observada en la imagen satelital. Finalmente, para facilitar su acceso hacia el usuario final, se desarrolla una plataforma web, compuesta por una interfaz gráfica y una interfaz de programación de aplicaciones, que permite seleccionar, con la ayuda de un mapa en la interfaz gráfica, imágenes satelitales para que sean procesadas por los modelos de redes neuronales y puedan ser las máscaras generadas visualizadas en conjunto con la imagen original.
Texto completo enlazado
A generative adversarial network approach for super resolution of sentinel-2 satellite images
(Pontificia Universidad Católica del Perú, 2020-03-17) Pineda Ancco, Ferdinand Edgardo; Beltrán Castañón, César Armando
Recently, satellites in operation offering very high-resolution (VHR) images has experienced an important increase, but they remain as a smaller proportion against existing lower resolution (HR) satellites. Our work proposes an alternative to improve the spatial resolution of HR images obtained by Sentinel-2 satellite by using the VHR images from PeruSat1, a Peruvian satellite, which serve as the reference for the superresolution approach implementation based on a Generative Adversarial Network (GAN) model, as an alternative for obtaining VHR images. The VHR PeruSat-1 image dataset is used for the training process of the network. The results obtained were analyzed considering the Peak Signal to Noise Ratios (PSNR), the Structural Similarity (SSIM) and the Erreur Relative Globale Adimensionnelle de Synth`ese (ERGAS). Finally, some visual outcomes, over a given testing dataset, are presented so the performance of the model could be analyzed as well.
Texto completo enlazado
Modelo convolucional para la detección de nódulos pulmonares a partir de tomografías 3D
(Pontificia Universidad Católica del Perú, 2019-05-23) Maldonado Cadenillas, Rodrigo Ricardo; Beltrán Castañón, César Armando
El cáncer al pulmón se ha convertido en una de las enfermedades con mayor incidencia a nivel mundial. Sin embargo, el análisis preventivo y detección de nódulos cancerígenos generalmente se realiza de forma manual por los radiólogos, lo cual ralentiza el proceso y genera posibles errores humanos. De esta manera, se han realizado diversas investigaciones sobre este problema utilizando Deep Learning como alternativa de solución para el análisis automático de tomografías. En este trabajo, se propone una aplicación y configuración de un modelo U- net, con bloques residuales y con regiones más rápidas para la detección de nódulos en tomografías computarizadas 3D. Los resultados obtenidos arrojan un FROC del 78 %, lo cual muestra que nuestra propuesta esta´ en el camino correcto, considerando las limitaciones de hardware en la que se ejecutó.
Texto completo enlazado
Segmentación automática de textos, mediante redes neuronales convolucionales en imágenes documentos históricos
(Pontificia Universidad Católica del Perú, 2018-11-28) Ascarza Mendoza, Franco Javier; Beltrán Castañón, César Armando
Los manuscritos históricos contienen valiosa información, en los últimos años se han realizado esfuerzos para digitalizar dicha información y ponerla al alcance de la comunidad científica y público en general a través de imágenes en bibliotecas virtuales y repositorios digitales. Sin embargo, existen documentos y manuscritos históricos escritos en un lenguaje extinto en la actualidad y una cantidad limitada de profesionales expertos en la interpretación y análisis de dichos documentos. Las imágenes de los documentos y manuscritos históricos poseen características particulares producto precisamente de su antigüedad como por ejemplo: La degradación del papel, el desvanecimiento de la tinta, la variabilidad en iluminación y textura, entre otros. Tareas como recuperación de información o traducción automática de imágenes de manuscritos históricos requieren una etapa de pre-procesamiento importante debido a las características mencionadas en el párrafo anterior. Entre las tareas de pre-procesamiento se puede mencionar la binarización y la segmentación de la imagen en regiones de interés. La presente tesis se enfoca en el procedimiento de segmentación en regiones de interés de las imágenes de manuscritos históricos. Existen métodos para segmentar imágenes de documentos históricos basados fundamentalmente en la extracción manual de características con previo conocimiento del dominio. La finalidad de la presente tesis es desarrollar un modelo general que automáticamente aprenda a extraer características de los pixeles de las imágenes de los documentos históricos y utilizar dichas características para clasificar los pixeles en las clases que previamente se definirán.
Texto completo enlazado
Registro automático de imágenes digitales de campos de cultivo aplicada a la agricultura de precisión con vehículos aéreos no tripulados
(Pontificia Universidad Católica del Perú, 2017-03-09) Melgarejo Román, Lucía Alejandra; Beltrán Castañón, César Armando
El presente proyecto de fin de carrera busca presentar un aporte al campo de la agricultura de precisión, el cual tiene como propósito aplicar y desarrollar nuevos mecanismos tecnológicos para optimizar las tareas involucradas en la agricultura. Una de las herramientas dentro de la agricultura de precisión es la percepción remota, con la cual se pueden obtener imágenes de los campos de cultivo a gran altura, permitiendo la identificación de características que no son fácilmente visibles cuando se está al nivel del suelo. Las imágenes capturadas mediante la percepción remota son empleadas por diversos especialistas en la interpretación de determinados índices de vegetación, cuyos resultados ayuden a facilitar y mejorar las tareas del agricultor. La captura de dichas imágenes es obtenida a través de sensores remotos colocados en satélites, aviones y actualmente, el uso de vehículos aéreos no tripulados (Unmanned Aerial Vehicle – UAV) ha sufrido un considerable incremento. Sin embargo se presentan algunos inconvenientes con respecto al procesamiento de las imágenes adquiridas por los UAVs. En primer lugar debido a la necesidad de monitoreo constante, es necesario que los UAVs sobrevuelen la zona a tratar periódicamente, generando una gran cantidad de imágenes de una misma zona a tratar en diferentes periodos de tiempo, resultando que en cada captura las imágenes de la misma zona presentan distintas características: traslación y rotación espacial (considerando un punto de referencia fijo) e iluminación. En segundo lugar, debido a la necesidad de determinación de parámetros de vegetación, temperatura, humedad, entre otros, es necesaria la obtención de imágenes con cámaras que trabajen en diferentes bandas del espectro electromagnético (bandas de color azul, rojo, verde e infrarrojo). En algunas ocasiones una sola cámara no trabaja en todas las bandas del espectro por lo que se requiere colocar más de una cámara en el UAV, con el resultado de que las imágenes capturadas de una misma zona no están alineadas espacialmente debido a la posición de las cámaras en el UAV. De este modo se hace necesario de algún método que permita la alineación de las imágenes capturadas por los UAVs, ya sea que estas provengan de diferentes puntos de vista o de diferentes sensores, para una misma zona a tratar. Al procedimiento requerido para la alineación de dos o más imágenes de un mismo objeto de interés se le conoce como registro de imágenes.
Texto completo enlazado
Extracción de descriptores de color y textura en imágenes digitales de plantas para la identificación de especímenes botánicos
(Pontificia Universidad Católica del Perú, 2017-02-15) Oncevay Marcos, Félix Arturo; Beltrán Castañón, César Armando
La identificación de la clasificación taxonómica de las plantas es un proceso realizado generalmente de forma manual por los especialistas botánicos en base a su experiencia. Sin embargo, la enorme variedad de especies de plantas, y la dificultad en la selección de propiedades o cualidades propias que permitan estimar una clasificación de las mismas, conforman un reto científico que se ha trasladado a un aspecto tecnológico para automatizar y apoyar dicho proceso. Por este motivo, se han propuesto diversos métodos desde los campos de reconocimiento de patrones y visión computacional para la identificación automática de las especies de plantas. Para esto, se suelen utilizar imágenes digitales de las hojas, debido a que esta es la parte de la planta que presenta una gran riqueza de atributos visuales como el color y la textura, que son objeto de esta investigación. En la investigación propuesta, se extraerán y combinaran diferentes grupos de descriptores de color y textura de las hojas en imágenes digitales escaneadas. Con dichos atributos, se entrenan algoritmos de aprendizaje de máquina para generar un modelo de clasificación que permita distinguir las especies de las plantas con una precisión aceptable según el estado del arte del problema. Para esto, se realizará un caso de estudio sobre el conjunto de imágenes de plantas: \ImageCLEF 2012", el cual posee un catálogo digital de hasta 115 especies botánicas diferentes.

Tesis y Trabajos de Investigación PUCP

Explorar

Filtros

Ajustes

Ordenar por

resultados por página

Resultados de búsqueda