Tesis y Trabajos de Investigación PUCP

URI permanente para esta comunidadhttp://54.81.141.168/handle/123456789/6

El Repositorio Digital de Tesis y Trabajos de Investigación PUCP aporta al Repositorio Institucional con todos sus registros, organizados por grado: Doctorado, Maestría, Licenciatura y Bachillerato. Se actualiza permanentemente con las nuevas tesis y trabajos de investigación sustentados y autorizados, así como también con los que que fueron sustentados años atrás.
Ingresa a su web: Repositorio Digital de Tesis y Trabajos de Investigación PUCP

Explorar

Resultados de búsqueda

Mostrando 1 - 2 de 2
  • Ítem
    Efficient algorithms for convolutional dictionary learning via accelerated proximal gradient
    (Pontificia Universidad Católica del Perú, 2019-04-05) Silva Obregón, Gustavo Manuel; Rodríguez Valderrama, Paul Antonio
    Convolutional sparse representations and convolutional dictionary learning are mathematical models that consist in representing a whole signal or image as a sum of convolutions between dictionary filters and coefficient maps. Unlike the patch-based counterparts, these convolutional forms are receiving an increase attention in multiple image processing tasks, since they do not present the usual patchwise drawbacks such as redundancy, multi-evaluations and non-translational invariant. Particularly, the convolutional dictionary learning (CDL) problem is addressed as an alternating minimization between coefficient update and dictionary update stages. A wide number of different algorithms based on FISTA (Fast Iterative Shrinkage-Thresholding Algorithm), ADMM (Alternating Direction Method of Multipliers) and ADMM consensus frameworks have been proposed to efficiently solve the most expensive steps of the CDL problem in the frequency domain. However, the use of the existing methods on large sets of images is computationally restricted by the dictionary update stage. The present thesis report is strategically organized in three parts. On the first part, we introduce the general topic of the CDL problem and the state-of-the-art methods used to deal with each stage. On the second part, we propose our first computationally efficient method to solve the entire CDL problem using the Accelerated Proximal Gradient (APG) framework in both updates. Additionally, a novel update model reminiscent of the Block Gauss-Seidel (BGS) method is incorporated to reduce the number of estimated components during the coefficient update. On the final part, we propose another alternative method to address the dictionary update stage based on APG consensus approach. This last method considers particular strategies of theADMMconsensus and our first APG framework to develop a less complex solution decoupled across the training images. In general, due to the lower number of operations, our first approach is a better serial option while our last approach has as advantage its independent and highly parallelizable structure. Finally, in our first set of experimental results, which is composed of serial implementations, we show that our first APG approach provides significant speedup with respect to the standard methods by a factor of 1:6 5:3. A complementary improvement by a factor of 2 is achieved by using the reminiscent BGS model. On the other hand, we also report that the second APG approach is the fastest method compared to the state-of-the-art consensus algorithm implemented in serial and parallel. Both proposed methods maintain comparable performance as the other ones in terms of reconstruction metrics, such as PSNR, SSIM and sparsity, in denoising and inpainting tasks.
  • Ítem
    Implementación de unwarping de videos omnidireccionales en la plataforma Jetson TK1
    (Pontificia Universidad Católica del Perú, 2015-11-27) Silva Obregón, Gustavo Manuel; Rodríguez Valderrama, Paúl Antonio
    El unwarping es un método utilizado para transformar imágenes omnidireccionales en imágenes panorámicas, el cual es empleado en aplicaciones tales como seguridad, visión robótica, geolocalización, etc. El procesamiento de imágenes omnidireccionales de alta resolución y su aplicación en dispositivos móviles se ve limitado por el costo computacional y costo energético. Para ello, se plantea como herramienta principal utilizar la plataforma Jetson TK1, la cual es un system on chip (SoC) creada por Nvidia que se caracteriza por su alto rendimiento computacional y bajo costo energético al tener incorporado 192 núcleos en su procesador gráfico. En el presente trabajo se desarrolla e implementa un algoritmo para realizar el unwarping de videos omnidireccionales en la plataforma Jetson TK1, la cual permite optimizar las transferencias y procesamientos de datos realizados en su GPU. El algoritmo es implementado en el entorno de programación MATLAB y CUDA para evaluar error por cálculo y eficiencia computacional. Asimismo, se compara en rendimiento computacional con el método PMPA, el cual es una alternativa escrita en lenguaje C computacionalmente eficiente en comparación a otros métodos presentados en el Capítulo 1. Los resultados de la comparación muestran que la implementación propuesta es 1.35 a 8.12 veces más rápida que el algoritmo PMPA para los tipos de interpolación utilizados (interpolación vecino más cercano e interpolación bilineal). El orden que sigue la tesis es el siguiente: En el primer capítulo se realizara un breve estado del arte sobre los métodos para realizar el unwarping de imágenes omnidireccionales. En el segundo capítulo se cubren los aspectos teóricos del modelo de programación CUDA necesarios para el diseño del algoritmo paralelo. En el tercer capítulo se describe de forma detallada el método propuesto y su diseño paralelo. Por ´ultimo, en el cuarto capítulo se presentan los resultados computacionales seguido de las conclusiones y recomendaciones. Finalmente, cabe señalar que el trabajo de investigación realizado fue presentado en el GPU Technology Conference 2015.