3. Licenciatura

Permanent URI for this communityhttp://54.81.141.168/handle/123456789/7312

Browse

Search Results

Now showing 1 - 7 of 7
  • Item
    Sistema en tiempo real de detección y seguimiento de objetos esféricos en videos digitales
    (Pontificia Universidad Católica del Perú, 2016-03-23) Tafur Tafur, José Elvis; Rodríguez Valderrama, Paúl Antonio
    En la actualidad, el desarrollo de sistemas que permitan la interacción ser humano - computador es un tema que es ampliamente abordado en diversas campos. Dispositivos tales como el Iphone, Ipad, la Samsung Galaxy Tab, entre otros, poseen aplicaciones de uso sencillo e intuitivo, brindando al usuario una experiencia de mayor realismo. Algunas de las aplicaciones más exitosas se dan en el sector del entretenimiento: El XBox 360, Nintendo Wii, Play Station 3 y 4 con sus diversos accesorios (cámaras, controladores, etc.) ofrecen juegos que interactuan con el ser humano en tiempo real. En medio de este contexto y conociendo del interés que existe por la investigación y desarrollo de sistemas en visión por computador, en la presente tesis se muestra el desarrollo de un sistema que permite la interacción ser humano - computador. Este sistema permite la detección y seguimiento de un objeto esférico en tiempo real, esto a través de una interfaz en la cual el usuario puede percibir el seguimiento de una esfera y cuyos movimientos son captados por una cámara de video. El planteamiento de la solución está inspirado en el sistema Play Station Move, el cual permite el seguimiento de una esfera ubicada en un controlador de movimiento, brindando al usuario una mayor sensación de realismo y control de las acciones realizadas. No obstante, y a diferencia del sistema desarrollado por Play Station, el presente estudio no hace uso de acelerómetros para el seguimiento planteado. El sistema a desarrollar opera bajo condiciones de precisión y tiempo de procesamiento que permite una interacción aceptable con el usuario, y se centra en el desarrollo e implementación de algoritmos matemáticos (en lenguaje C) en tiempo real que permiten la detección y seguimiento del objeto esférico. Para la interfaz computador - cámara de video se utiliza una librería ya existente, previamente desarrollada en el laboratorio de DSP, la cual a su vez está basada en la librería ffmpeg.
  • Item
    Algoritmo de estimación del número de elementos móviles en videos digitales orientado a la gestión del tráfico vehicular
    (Pontificia Universidad Católica del Perú, 2015-11-28) Quesada Pacora, Jorge Gerardo; Rodríguez Valderrama, Paúl Antonio
    La gestión automatizada del tránsito es un campo de investigación que integra una variedad de tecnologías y se orienta principalmente a mejorar el flujo vehicular, haciendo uso de cámaras y otros sensores para recabar información sobre el estado del tráfico. En este contexto, las técnicas de procesamiento de imágenes digitales permiten realizar diversos análisis del entorno urbano, tales como detección, conteo y seguimiento de peatones y vehículos. Entre las capacidades que requieren los sistemas que realizan dicha gestión, la estimación del número de vehículos en circulación es una de las principales. Para obtener una estimación adecuada del número de elementos móviles en un vídeo, primero debe realizarse una adecuada segmentación de dichos elementos. Existe una gran variedad de métodos que realizan dicha segmentación, sin embargo PCP (Principal Component Pursuit) es considerado el estado del arte para el modelado de fondo de vídeos digitales en donde el sensor (cámara) es estático. El objetivo de la presente tesis es el diseño de un algoritmo que estime el número de vehículos presentes en un vídeo digital de tránsito, que tenga como etapa de pre-procesamiento la segmentación de movimiento mediante PCP (utilizando una librería independiente) y funcione de manera semiautomática. Se busca también proponer una estrategia adecuada para dividir las etapas del algoritmo, de modo que ´este pueda ser descrito como un conjunto flexible de bloques, implementable en cualquier plataforma o entorno. El método propuesto se divide en dos bloques principales: entrenamiento (supervisado) y conteo (automático). Ambos bloques realizan la extracción del movimiento mediante PCP. El primer bloque genera los parámetros necesarios para el conteo mediante un análisis de las dimensiones de los objetos móviles. El segundo realiza el conteo mediante el uso de los parámetros proporcionados por la etapa de entrenamiento. Para evaluar el rendimiento del algoritmo, este ser´a implementado en el entorno de programación Matlab, y se generar´a una base de datos propia. Dicho rendimiento será evaluado en dos dimensiones: el número instantáneo de vehículos en escena y el número de vehículos que atraviesan una “puerta virtual” en un tiempo determinado. En el primer capítulo de la tesis se define puntualmente el problema que se busca resolver. En el segundo capítulo se revisan los métodos y algoritmos más populares para segmentar el movimiento, haciendo especial énfasis en PCP. Las consideraciones de diseño y los detalles del algoritmo se especifican en el capítulo tres. Finalmente, se presentan los resultados obtenidos en el capítulo cuatro, seguido de las conclusiones y recomendaciones al respecto.
  • Item
    Implementación de unwarping de videos omnidireccionales en la plataforma Jetson TK1
    (Pontificia Universidad Católica del Perú, 2015-11-27) Silva Obregón, Gustavo Manuel; Rodríguez Valderrama, Paúl Antonio
    El unwarping es un método utilizado para transformar imágenes omnidireccionales en imágenes panorámicas, el cual es empleado en aplicaciones tales como seguridad, visión robótica, geolocalización, etc. El procesamiento de imágenes omnidireccionales de alta resolución y su aplicación en dispositivos móviles se ve limitado por el costo computacional y costo energético. Para ello, se plantea como herramienta principal utilizar la plataforma Jetson TK1, la cual es un system on chip (SoC) creada por Nvidia que se caracteriza por su alto rendimiento computacional y bajo costo energético al tener incorporado 192 núcleos en su procesador gráfico. En el presente trabajo se desarrolla e implementa un algoritmo para realizar el unwarping de videos omnidireccionales en la plataforma Jetson TK1, la cual permite optimizar las transferencias y procesamientos de datos realizados en su GPU. El algoritmo es implementado en el entorno de programación MATLAB y CUDA para evaluar error por cálculo y eficiencia computacional. Asimismo, se compara en rendimiento computacional con el método PMPA, el cual es una alternativa escrita en lenguaje C computacionalmente eficiente en comparación a otros métodos presentados en el Capítulo 1. Los resultados de la comparación muestran que la implementación propuesta es 1.35 a 8.12 veces más rápida que el algoritmo PMPA para los tipos de interpolación utilizados (interpolación vecino más cercano e interpolación bilineal). El orden que sigue la tesis es el siguiente: En el primer capítulo se realizara un breve estado del arte sobre los métodos para realizar el unwarping de imágenes omnidireccionales. En el segundo capítulo se cubren los aspectos teóricos del modelo de programación CUDA necesarios para el diseño del algoritmo paralelo. En el tercer capítulo se describe de forma detallada el método propuesto y su diseño paralelo. Por ´ultimo, en el cuarto capítulo se presentan los resultados computacionales seguido de las conclusiones y recomendaciones. Finalmente, cabe señalar que el trabajo de investigación realizado fue presentado en el GPU Technology Conference 2015.
  • Item
    Implementación del método gradiente conjugado en un FPGA arquitectura Spartan 6
    (Pontificia Universidad Católica del Perú, 2014-07-25) Sosa Cordova, Stefano André; Rodríguez Valderrama, Paúl Antonio
    Resolver un sistema de ecuaciones lineales simult´aneas es un problema fundamental en el algebra lineal num´erica, y una de las etapas elementales en simulaciones cient´ıficas. Ejemplos son los problemas de ciencias e ingenier´ıa modelados por ecuaciones diferenciales ordinarias o parciales, cuya soluci´on num´erica est´a basada en m´etodos de discretizaci´on que conducen a sistemas de ecuaciones lineales. Estos sistemas pueden ser resueltos de manera directa; sin embargo, cuando el orden del sistema es demasiado grande el costo computacional se incrementa. Ante esta situaci´on se emplean m´etodos iterativos, los cuales son m´as eficientes y tienen una menor demanda computacional (p.e: Jacobi, Gauss-Seidel, Gradiente Conjugado, etc.). En el presente trabajo se presenta un sistema digital basado en un procesador, un coprocesador y una memoria externa que desarrolla el m´etodo del Gradiente Conjugado. El sistema fue implementado en la arquitectura Spartan-6, la cual cuenta con un softprocessor de 32 bits llamado MicroBlaze y el FPGA propiamente dicho. MicroBlaze dirige el flujo del algoritmo, adem´as de desempe˜nar las operaciones m´as sencillas (sumas vectoriales, productos internos, divisiones, etc). En tanto, en el FPGA se implement´o un coprocesador, el cual fue descrito en VHDL, que se encarga de la operaci´on de mayor costo computacional: el producto Matriz - Vector. El procesador y el coprocesador se comunican mediante interfaces unidireccionales basadas en unidades FIFO llamadas Fast Simplex Link (FSL). Se emple´o el entorno EDK (Embedded Development Kit) de la empresa Xilinx, para configurar el procesador, los perif´ericos y el coprocesador; y se emple´o la plataforma Atlys de la empresa Digilent para implementar el sistema propuesto. La implementaci´on final es aproximadamente 2 veces m´as r´apida y tiene una eficiencia de 0.25, respecto de la implementaci´on de referencia que se desarroll ´o empleando solo el procesador. El orden que sigue la tesis es el siguiente: En el primer cap´ıtulo se presenta el contexto de la tesis y se define puntualmente el problema que se desea resolver. En el segundo cap´ıtulo se cubre la mayor´ıa de aspectos te´oricos necesarios. La arquitectura propuesta, y los detalles de los componentes del sistema se especifican en el cap´ıtulo tres. Por ´ultimo, se presentan los resultados en el cap´ıtulo cuatro, seguido de las conclusiones.
  • Item
    Detección y seguimiento de manos en videos digitales utilizando computadores y mini-computadores
    (Pontificia Universidad Católica del Perú, 2014-05-12) Cisneros Velarde, Pedro Arturo; Rodríguez Valderrama, Paúl Antonio
    El problema del seguimiento de manos o hand tracking puede definirse como la capacidad de un sistema computacional de poder reconocer las manos de un individuo (usuario) y hacerles un seguimiento en todo momento. El inter´es por el estudio del movimiento de las manos se debe a dos particularidades. En primer lugar, se debe a que las manos son protagonistas en la realizaci´on de varias tareas diarias del ser humano, pues las manos son un distintivo de las diferentes actividades humanas. Las manos permite la manipulaci ´on de objetos; de lo cual se basa una gran dimensi´on de la interactividad del hombre con sus diferentes herramientas de trabajo [1]. No es de sorprender que, con el reconocimiento del movimiento de las manos, se puedan reconocer varias actividades de las personas: comer, saludar, martillar, apu˜nar, se˜nalar, etc. En segundo lugar, las manos, junto con el rostro, son los dos mayores indicadores gestuales dentro de la comunicación no verbal; lo cual indica que en las manos hay un gran despliegue de diferentes gestos, seas y apariencias, y por tanto, tengan una gran riqueza de significado comunicativo.
  • Item
    Estimación automática de la varianza y discriminación de distribuciones de ruido en imágenes digitales
    (Pontificia Universidad Católica del Perú, 2013-05-13) Reátegui Woll, Jaime Cesar; Rodríguez Valderrama, Paúl Antonio
    Existen diversos sistemas de adquisición de imágenes, algunos de ellos son: CCD (Charge Couple Devices), sistemas basados en luz coherente, MRI (Magnetic Resonance Imaging), imágenes SAR (Radar de apertura sintética), etc. En todos los casos, las imágenes generadas se encuentran afectadas en alguna medida por distintos tipos de ruido. Se han estudiado y desarrollado diversos métodos para eliminar el ruido presente, para así obtener una mejor estimación de la escena de interés. La mayoría de algoritmos de restauración de imágenes digitales asumen que la clase de ruido y sus parámetros característicos son conocidos (p.e: varianza, coeficiente de variación, etc.). En la presente tesis se desarrolla e implementa un algoritmo para la estimación automática de la varianza y discriminación de la distribución del ruido presente en una imagen digital. La metodología propuesta se encuentra dividida en dos bloques principales. El primer bloque estima la varianza del ruido presente en la imagen utilizando un método basado en el cálculo de la moda de las varianzas obtenidas a partir de ventanas locales (segmentos de la imagen). El segundo bloque transforma una distribución de ruido específica en una distribución Gaussiana con varianza unitaria utilizando transformaciones de estabilización de varianza. Estos dos bloques trabajan de manera conjunta y automática haciendo uso de diversas reglas de decisión para, finalmente, poder discriminar la distribución que presenta la imagen digital analizada. El algoritmo será implementado en el software MATLAB y será capaz de discriminar entre las siguientes cuatro tipos de ruido: aditivo Gaussiano, multiplicativo Gamma, multiplicativo Rayleigh y Poisson. Los resultados computacionales se obtendrán a partir de imágenes con ruido cuya distribución y magnitud son conocidas. Los resultados obtenidos pueden ser utilizados luego para distintos tipos de pruebas. El orden que sigue la tesis es el siguiente: En el primer capítulo se define puntualmente el problema que se busca resolver. En el segundo capítulo se cubren todos los aspectos teóricos necesarios, así como los diversos métodos, algoritmos o estudios realizados anteriormente sobre este tema. El diagrama de bloques y los detalles del algoritmo se especifican en el capítulo tres. Por último, se presentan los resultados en el capítulo cuatro seguido de las conclusiones y recomendaciones.
  • Item
    Diseño y simulación de un scrambler digital de voz
    (Pontificia Universidad Católica del Perú, 2012-10-15) Montoya Limón, Roberto Isaac; Rodríguez Valderrama, Paúl Antonio
    Un primer acercamiento a la definición de comunicación puede realizarse desde su etimología. La palabra deriva del latín communicare, que significa “compartir algo, poner en común”. Por lo tanto, la comunicación es el proceso mediante el cual el emisor y el receptor establecen una conexión en un momento y espacio determinados para compartir ideas, transmitir e intercambiar información o significados que son comprensibles para ambos. Desde un punto de vista técnico se entiende por comunicación al hecho que un determinado mensaje originado por el emisor llegue a un receptor, distante en el espacio o en el tiempo. La comunicación implica transmitir y recepcionar una determinada información que en la actualidad se encuentra muy vulnerable e insegura debido a las interceptaciones, la existencia de intereses personales, empresariales o de terceros. Este problema ha motivado la presente tesis a diseñar una alternativa de solución mediante el cual se mejora la confidencialidad de las comunicaciones que en su mayoría de casos se requiere. En tal sentido, la presente tesis tiene como objetivo presentar un Diseño y Simulación de un Scrambler Digital de Voz, el cual permitirá codificar la señal de voz a fin de transmitirla por el canal. La transmisión permitirá la comunicación exclusiva entre el emisor y receptor. Sólo el receptor podrá decodificar el mensaje y a su vez recibirá del emisor una contraseña que será establecida aleatoriamente en cada transmisión. Para la recepción, se decodificará la señal de voz con la contraseña recibida aleatoriamente garantizando de esta manera una comunicación segura.