Tesis y Trabajos de Investigación PUCP
URI permanente para esta comunidadhttp://54.81.141.168/handle/123456789/6
El Repositorio Digital de Tesis y Trabajos de Investigación PUCP aporta al Repositorio Institucional con todos sus registros, organizados por grado: Doctorado, Maestría, Licenciatura y Bachillerato. Se actualiza permanentemente con las nuevas tesis y trabajos de investigación sustentados y autorizados, así como también con los que que fueron sustentados años atrás.
Ingresa a su web: Repositorio Digital de Tesis y Trabajos de Investigación PUCP
Explorar
10 resultados
Resultados de búsqueda
Ítem Texto completo enlazado Sistema en tiempo real de detección y seguimiento de objetos esféricos en videos digitales(Pontificia Universidad Católica del Perú, 2016-03-23) Tafur Tafur, José Elvis; Rodríguez Valderrama, Paúl AntonioEn la actualidad, el desarrollo de sistemas que permitan la interacción ser humano - computador es un tema que es ampliamente abordado en diversas campos. Dispositivos tales como el Iphone, Ipad, la Samsung Galaxy Tab, entre otros, poseen aplicaciones de uso sencillo e intuitivo, brindando al usuario una experiencia de mayor realismo. Algunas de las aplicaciones más exitosas se dan en el sector del entretenimiento: El XBox 360, Nintendo Wii, Play Station 3 y 4 con sus diversos accesorios (cámaras, controladores, etc.) ofrecen juegos que interactuan con el ser humano en tiempo real. En medio de este contexto y conociendo del interés que existe por la investigación y desarrollo de sistemas en visión por computador, en la presente tesis se muestra el desarrollo de un sistema que permite la interacción ser humano - computador. Este sistema permite la detección y seguimiento de un objeto esférico en tiempo real, esto a través de una interfaz en la cual el usuario puede percibir el seguimiento de una esfera y cuyos movimientos son captados por una cámara de video. El planteamiento de la solución está inspirado en el sistema Play Station Move, el cual permite el seguimiento de una esfera ubicada en un controlador de movimiento, brindando al usuario una mayor sensación de realismo y control de las acciones realizadas. No obstante, y a diferencia del sistema desarrollado por Play Station, el presente estudio no hace uso de acelerómetros para el seguimiento planteado. El sistema a desarrollar opera bajo condiciones de precisión y tiempo de procesamiento que permite una interacción aceptable con el usuario, y se centra en el desarrollo e implementación de algoritmos matemáticos (en lenguaje C) en tiempo real que permiten la detección y seguimiento del objeto esférico. Para la interfaz computador - cámara de video se utiliza una librería ya existente, previamente desarrollada en el laboratorio de DSP, la cual a su vez está basada en la librería ffmpeg.Ítem Texto completo enlazado Algoritmo de estimación del número de elementos móviles en videos digitales orientado a la gestión del tráfico vehicular(Pontificia Universidad Católica del Perú, 2015-11-28) Quesada Pacora, Jorge Gerardo; Rodríguez Valderrama, Paúl AntonioLa gestión automatizada del tránsito es un campo de investigación que integra una variedad de tecnologías y se orienta principalmente a mejorar el flujo vehicular, haciendo uso de cámaras y otros sensores para recabar información sobre el estado del tráfico. En este contexto, las técnicas de procesamiento de imágenes digitales permiten realizar diversos análisis del entorno urbano, tales como detección, conteo y seguimiento de peatones y vehículos. Entre las capacidades que requieren los sistemas que realizan dicha gestión, la estimación del número de vehículos en circulación es una de las principales. Para obtener una estimación adecuada del número de elementos móviles en un vídeo, primero debe realizarse una adecuada segmentación de dichos elementos. Existe una gran variedad de métodos que realizan dicha segmentación, sin embargo PCP (Principal Component Pursuit) es considerado el estado del arte para el modelado de fondo de vídeos digitales en donde el sensor (cámara) es estático. El objetivo de la presente tesis es el diseño de un algoritmo que estime el número de vehículos presentes en un vídeo digital de tránsito, que tenga como etapa de pre-procesamiento la segmentación de movimiento mediante PCP (utilizando una librería independiente) y funcione de manera semiautomática. Se busca también proponer una estrategia adecuada para dividir las etapas del algoritmo, de modo que ´este pueda ser descrito como un conjunto flexible de bloques, implementable en cualquier plataforma o entorno. El método propuesto se divide en dos bloques principales: entrenamiento (supervisado) y conteo (automático). Ambos bloques realizan la extracción del movimiento mediante PCP. El primer bloque genera los parámetros necesarios para el conteo mediante un análisis de las dimensiones de los objetos móviles. El segundo realiza el conteo mediante el uso de los parámetros proporcionados por la etapa de entrenamiento. Para evaluar el rendimiento del algoritmo, este ser´a implementado en el entorno de programación Matlab, y se generar´a una base de datos propia. Dicho rendimiento será evaluado en dos dimensiones: el número instantáneo de vehículos en escena y el número de vehículos que atraviesan una “puerta virtual” en un tiempo determinado. En el primer capítulo de la tesis se define puntualmente el problema que se busca resolver. En el segundo capítulo se revisan los métodos y algoritmos más populares para segmentar el movimiento, haciendo especial énfasis en PCP. Las consideraciones de diseño y los detalles del algoritmo se especifican en el capítulo tres. Finalmente, se presentan los resultados obtenidos en el capítulo cuatro, seguido de las conclusiones y recomendaciones al respecto.Ítem Texto completo enlazado Implementación de unwarping de videos omnidireccionales en la plataforma Jetson TK1(Pontificia Universidad Católica del Perú, 2015-11-27) Silva Obregón, Gustavo Manuel; Rodríguez Valderrama, Paúl AntonioEl unwarping es un método utilizado para transformar imágenes omnidireccionales en imágenes panorámicas, el cual es empleado en aplicaciones tales como seguridad, visión robótica, geolocalización, etc. El procesamiento de imágenes omnidireccionales de alta resolución y su aplicación en dispositivos móviles se ve limitado por el costo computacional y costo energético. Para ello, se plantea como herramienta principal utilizar la plataforma Jetson TK1, la cual es un system on chip (SoC) creada por Nvidia que se caracteriza por su alto rendimiento computacional y bajo costo energético al tener incorporado 192 núcleos en su procesador gráfico. En el presente trabajo se desarrolla e implementa un algoritmo para realizar el unwarping de videos omnidireccionales en la plataforma Jetson TK1, la cual permite optimizar las transferencias y procesamientos de datos realizados en su GPU. El algoritmo es implementado en el entorno de programación MATLAB y CUDA para evaluar error por cálculo y eficiencia computacional. Asimismo, se compara en rendimiento computacional con el método PMPA, el cual es una alternativa escrita en lenguaje C computacionalmente eficiente en comparación a otros métodos presentados en el Capítulo 1. Los resultados de la comparación muestran que la implementación propuesta es 1.35 a 8.12 veces más rápida que el algoritmo PMPA para los tipos de interpolación utilizados (interpolación vecino más cercano e interpolación bilineal). El orden que sigue la tesis es el siguiente: En el primer capítulo se realizara un breve estado del arte sobre los métodos para realizar el unwarping de imágenes omnidireccionales. En el segundo capítulo se cubren los aspectos teóricos del modelo de programación CUDA necesarios para el diseño del algoritmo paralelo. En el tercer capítulo se describe de forma detallada el método propuesto y su diseño paralelo. Por ´ultimo, en el cuarto capítulo se presentan los resultados computacionales seguido de las conclusiones y recomendaciones. Finalmente, cabe señalar que el trabajo de investigación realizado fue presentado en el GPU Technology Conference 2015.Ítem Texto completo enlazado Multi-scale image inpainting with label selection based on local statistics(Pontificia Universidad Católica del Perú, 2014-09-09) Paredes Zevallos, Daniel Leoncio; Rodríguez Valderrama, Paúl AntonioWe proposed a novel inpainting method where we use a multi-scale approach to speed up the well-known Markov Random Field (MRF) based inpainting method. MRF based inpainting methods are slow when compared with other exemplar-based methods, because its computational complexity is O(jLj2) (L feasible solutions’ labels). Our multi-scale approach seeks to reduces the number of the L (feasible) labels by an appropiate selection of the labels using the information of the previous (low resolution) scale. For the initial label selection we use local statistics; moreover, to compensate the loss of information in low resolution levels we use features related to the original image gradient. Our computational results show that our approach is competitive, in terms reconstruction quality, when compare to the original MRF based inpainting, as well as other exemplarbased inpaiting algorithms, while being at least one order of magnitude faster than the original MRF based inpainting and competitive with exemplar-based inpaiting.Ítem Texto completo enlazado Implementación del método gradiente conjugado en un FPGA arquitectura Spartan 6(Pontificia Universidad Católica del Perú, 2014-07-25) Sosa Cordova, Stefano André; Rodríguez Valderrama, Paúl AntonioResolver un sistema de ecuaciones lineales simult´aneas es un problema fundamental en el algebra lineal num´erica, y una de las etapas elementales en simulaciones cient´ıficas. Ejemplos son los problemas de ciencias e ingenier´ıa modelados por ecuaciones diferenciales ordinarias o parciales, cuya soluci´on num´erica est´a basada en m´etodos de discretizaci´on que conducen a sistemas de ecuaciones lineales. Estos sistemas pueden ser resueltos de manera directa; sin embargo, cuando el orden del sistema es demasiado grande el costo computacional se incrementa. Ante esta situaci´on se emplean m´etodos iterativos, los cuales son m´as eficientes y tienen una menor demanda computacional (p.e: Jacobi, Gauss-Seidel, Gradiente Conjugado, etc.). En el presente trabajo se presenta un sistema digital basado en un procesador, un coprocesador y una memoria externa que desarrolla el m´etodo del Gradiente Conjugado. El sistema fue implementado en la arquitectura Spartan-6, la cual cuenta con un softprocessor de 32 bits llamado MicroBlaze y el FPGA propiamente dicho. MicroBlaze dirige el flujo del algoritmo, adem´as de desempe˜nar las operaciones m´as sencillas (sumas vectoriales, productos internos, divisiones, etc). En tanto, en el FPGA se implement´o un coprocesador, el cual fue descrito en VHDL, que se encarga de la operaci´on de mayor costo computacional: el producto Matriz - Vector. El procesador y el coprocesador se comunican mediante interfaces unidireccionales basadas en unidades FIFO llamadas Fast Simplex Link (FSL). Se emple´o el entorno EDK (Embedded Development Kit) de la empresa Xilinx, para configurar el procesador, los perif´ericos y el coprocesador; y se emple´o la plataforma Atlys de la empresa Digilent para implementar el sistema propuesto. La implementaci´on final es aproximadamente 2 veces m´as r´apida y tiene una eficiencia de 0.25, respecto de la implementaci´on de referencia que se desarroll ´o empleando solo el procesador. El orden que sigue la tesis es el siguiente: En el primer cap´ıtulo se presenta el contexto de la tesis y se define puntualmente el problema que se desea resolver. En el segundo cap´ıtulo se cubre la mayor´ıa de aspectos te´oricos necesarios. La arquitectura propuesta, y los detalles de los componentes del sistema se especifican en el cap´ıtulo tres. Por ´ultimo, se presentan los resultados en el cap´ıtulo cuatro, seguido de las conclusiones.Ítem Texto completo enlazado Detección y seguimiento de manos en videos digitales utilizando computadores y mini-computadores(Pontificia Universidad Católica del Perú, 2014-05-12) Cisneros Velarde, Pedro Arturo; Rodríguez Valderrama, Paúl AntonioEl problema del seguimiento de manos o hand tracking puede definirse como la capacidad de un sistema computacional de poder reconocer las manos de un individuo (usuario) y hacerles un seguimiento en todo momento. El inter´es por el estudio del movimiento de las manos se debe a dos particularidades. En primer lugar, se debe a que las manos son protagonistas en la realizaci´on de varias tareas diarias del ser humano, pues las manos son un distintivo de las diferentes actividades humanas. Las manos permite la manipulaci ´on de objetos; de lo cual se basa una gran dimensi´on de la interactividad del hombre con sus diferentes herramientas de trabajo [1]. No es de sorprender que, con el reconocimiento del movimiento de las manos, se puedan reconocer varias actividades de las personas: comer, saludar, martillar, apu˜nar, se˜nalar, etc. En segundo lugar, las manos, junto con el rostro, son los dos mayores indicadores gestuales dentro de la comunicación no verbal; lo cual indica que en las manos hay un gran despliegue de diferentes gestos, seas y apariencias, y por tanto, tengan una gran riqueza de significado comunicativo.Ítem Texto completo enlazado Computationally inexpensive parallel parking supervisor based on video processing(Pontificia Universidad Católica del Perú, 2013-12-05) Espejo Pérez, Caterina María; Rodríguez Valderrama, Paúl AntonioParallel parking, in general, is a moderate difficulty maneuver. Moreover, for inexperienced drivers, it can be a stressful situation that can lead to errors such as stay far from the sidewalk or damage another vehicle resulting in traffic tickets that range from simple parking violation to crash-related violations. In this work, we propose a computationally effective approach to perform a collisionfree parallel parking. The method will calculate the minimum parking space needed and then the efficient path for the parallel parking. This method is computationally inexpensive in comparison with the current state of the art. Moreover, it could be used by any car because the parameters needed to perform all computations are taken from the specifications of real cars. Preliminary results of this work were summarized in [1] that was presented at the 15th International IEEE Conference on Intelligent Transportation Systems. The simulation and experimental data show the effectiveness of the method. This effectiveness is specified when the path followed by the driver and the path calculated with the method are compared. The image capture of the vehicle is used to get the path made by the driver for the parallel parking. Furthermore, road surface marks were determined (in a parking lot) as a visual aid for the drivers in order to perform the parallel parking maneuver. After analyzing the paths, it is noted that the vehicles that properly followed the marks, parked correctly.Ítem Texto completo enlazado Estimación automática de la varianza y discriminación de distribuciones de ruido en imágenes digitales(Pontificia Universidad Católica del Perú, 2013-05-13) Reátegui Woll, Jaime Cesar; Rodríguez Valderrama, Paúl AntonioExisten diversos sistemas de adquisición de imágenes, algunos de ellos son: CCD (Charge Couple Devices), sistemas basados en luz coherente, MRI (Magnetic Resonance Imaging), imágenes SAR (Radar de apertura sintética), etc. En todos los casos, las imágenes generadas se encuentran afectadas en alguna medida por distintos tipos de ruido. Se han estudiado y desarrollado diversos métodos para eliminar el ruido presente, para así obtener una mejor estimación de la escena de interés. La mayoría de algoritmos de restauración de imágenes digitales asumen que la clase de ruido y sus parámetros característicos son conocidos (p.e: varianza, coeficiente de variación, etc.). En la presente tesis se desarrolla e implementa un algoritmo para la estimación automática de la varianza y discriminación de la distribución del ruido presente en una imagen digital. La metodología propuesta se encuentra dividida en dos bloques principales. El primer bloque estima la varianza del ruido presente en la imagen utilizando un método basado en el cálculo de la moda de las varianzas obtenidas a partir de ventanas locales (segmentos de la imagen). El segundo bloque transforma una distribución de ruido específica en una distribución Gaussiana con varianza unitaria utilizando transformaciones de estabilización de varianza. Estos dos bloques trabajan de manera conjunta y automática haciendo uso de diversas reglas de decisión para, finalmente, poder discriminar la distribución que presenta la imagen digital analizada. El algoritmo será implementado en el software MATLAB y será capaz de discriminar entre las siguientes cuatro tipos de ruido: aditivo Gaussiano, multiplicativo Gamma, multiplicativo Rayleigh y Poisson. Los resultados computacionales se obtendrán a partir de imágenes con ruido cuya distribución y magnitud son conocidas. Los resultados obtenidos pueden ser utilizados luego para distintos tipos de pruebas. El orden que sigue la tesis es el siguiente: En el primer capítulo se define puntualmente el problema que se busca resolver. En el segundo capítulo se cubren todos los aspectos teóricos necesarios, así como los diversos métodos, algoritmos o estudios realizados anteriormente sobre este tema. El diagrama de bloques y los detalles del algoritmo se especifican en el capítulo tres. Por último, se presentan los resultados en el capítulo cuatro seguido de las conclusiones y recomendaciones.Ítem Texto completo enlazado Automatic regularization parameter selection for the total variation mixed noise image restoration framework(Pontificia Universidad Católica del Perú, 2013-03-27) Rojas Gómez, Renán Alfredo; Rodríguez Valderrama, Paúl AntonioImage restoration consists in recovering a high quality image estimate based only on observations. This is considered an ill-posed inverse problem, which implies non-unique unstable solutions. Regularization methods allow the introduction of constraints in such problems and assure a stable and unique solution. One of these methods is Total Variation, which has been broadly applied in signal processing tasks such as image denoising, image deconvolution, and image inpainting for multiple noise scenarios. Total Variation features a regularization parameter which defines the solution regularization impact, a crucial step towards its high quality level. Therefore, an optimal selection of the regularization parameter is required. Furthermore, while the classic Total Variation applies its constraint to the entire image, there are multiple scenarios in which this approach is not the most adequate. Defining different regularization levels to different image elements benefits such cases. In this work, an optimal regularization parameter selection framework for Total Variation image restoration is proposed. It covers two noise scenarios: Impulse noise and Impulse over Gaussian Additive noise. A broad study of the state of the art, which covers noise estimation algorithms, risk estimation methods, and Total Variation numerical solutions, is included. In order to approach the optimal parameter estimation problem, several adaptations are proposed in order to create a local-fashioned regularization which requires no a-priori information about the noise level. Quality and performance results, which include the work covered in two recently published articles, show the effectivity of the proposed regularization parameter selection and a great improvement over the global regularization framework, which attains a high quality reconstruction comparable with the state of the art algorithms.Ítem Texto completo enlazado Diseño y simulación de un scrambler digital de voz(Pontificia Universidad Católica del Perú, 2012-10-15) Montoya Limón, Roberto Isaac; Rodríguez Valderrama, Paúl AntonioUn primer acercamiento a la definición de comunicación puede realizarse desde su etimología. La palabra deriva del latín communicare, que significa “compartir algo, poner en común”. Por lo tanto, la comunicación es el proceso mediante el cual el emisor y el receptor establecen una conexión en un momento y espacio determinados para compartir ideas, transmitir e intercambiar información o significados que son comprensibles para ambos. Desde un punto de vista técnico se entiende por comunicación al hecho que un determinado mensaje originado por el emisor llegue a un receptor, distante en el espacio o en el tiempo. La comunicación implica transmitir y recepcionar una determinada información que en la actualidad se encuentra muy vulnerable e insegura debido a las interceptaciones, la existencia de intereses personales, empresariales o de terceros. Este problema ha motivado la presente tesis a diseñar una alternativa de solución mediante el cual se mejora la confidencialidad de las comunicaciones que en su mayoría de casos se requiere. En tal sentido, la presente tesis tiene como objetivo presentar un Diseño y Simulación de un Scrambler Digital de Voz, el cual permitirá codificar la señal de voz a fin de transmitirla por el canal. La transmisión permitirá la comunicación exclusiva entre el emisor y receptor. Sólo el receptor podrá decodificar el mensaje y a su vez recibirá del emisor una contraseña que será establecida aleatoriamente en cada transmisión. Para la recepción, se decodificará la señal de voz con la contraseña recibida aleatoriamente garantizando de esta manera una comunicación segura.