Ingeniería Electrónica

Permanent URI for this collectionhttp://54.81.141.168/handle/123456789/9137

Browse

Search Results

Now showing 1 - 2 of 2
  • Item
    Análisis de flujo peatonal en una intersección de avenidas utilizando procesamiento de imágenes
    (Pontificia Universidad Católica del Perú, 2021-12-15) Reátegui Arones, Rolando Jesús; Crisóstomo Romero, Pedro Moisés
    En diversos cruces de avenidas de la ciudad de Lima, se observan patrones anormales de comportamiento peatonal, inadecuada semaforización y diseño vial no ideal para los peatones. Estos últimos son los más vulnerables en los accidentes de tránsito y son quienes deberían requerir mayor prioridad en el diseño de intersecciones. Para mejorar los diseños de las intersecciones se requiere datos de flujo peatonal, que se pueden medir de diversas maneras. Actualmente, el método de conteo de peatones utilizado es manual, el cual es realizado por equipos de personas desde una esquina o mediante una grabación y que tiene una baja eficiencia por error humano, además del costo por hora que ello implica. Por esta razón, la presente tesis expone nuevos métodos de conteo más eficaces ejecutados en una intersección conocida y sus resultados comparados con cifras esperadas. El primer capítulo de la tesis presenta el marco problemático que justifica la importancia de la presente tesis, los métodos generales usuales para detección de peatones y expone los objetivos de la tesis. El segundo capítulo describe los fundamentos teóricos sobre procesamiento de imágenes utilizados para el desarrollo de los posteriores capítulos y los métodos específicos para cada etapa del algoritmo. El tercer capítulo enumera los pasos de la propuesta para el conteo de peatones, las funciones implementadas y librerías utilizadas para cada una de las etapas de esta aplicación. Por último, el cuarto capítulo revisa los resultados de la propuesta por cada etapa para diferentes videos y hace un análisis de estos para su recomendación de uso en futuras aplicaciones.
  • Item
    Formación de imagen completa de una página con texto impreso mediante procesamiento de imágenes obtenidas de un video
    (Pontificia Universidad Católica del Perú, 2020-12-07) Ramírez Díaz, José Fernando; Crisóstomo Romero, Pedro Moisés
    En la presente tesis se aborda el diseño e implementación de un algoritmo que permite formar la imagen completa de un documento con texto impreso partiendo de un video que contiene fragmentos de la página en cuestión. Dicho algoritmo recibe como entrada un video registrado empleando la cámara de un teléfono móvil y como resultado retornará la imagen del documento con texto completo; esta imagen puede ser empleada posteriormente en un algoritmo de reconocimiento óptico de caracteres (u OCR por sus siglas en inglés) para recuperar el texto en forma digital. El enfoque del desarrollo de esta propuesta es el de brindar una solución alternativa, en cuanto a adquisición de imágenes, para las existentes aplicaciones móviles de OCR enfocadas en apoyar a personas con ceguera parcial o total. Para abarcar el planteamiento y cumplimiento de los objetivos de este proyecto, se ha estructurado el mismo en 4 capítulos. En el capítulo 1 se aborda la actual situación de personas con distintos grados de discapacidad visual en nuestro país y diversos sistemas que buscan apoyarlos en recuperar su autonomía informativa y educativa. Además, se trata detalles sobre el estado del arte en adquisición de imágenes para las aplicaciones OCR existentes en la actualidad y sus falencias. En el capítulo 2 se presenta el marco teórico que avala el desarrollo del algoritmo propuesto, desde la teoría necesaria en procesamiento de imágenes y, también, sobre el registro de vídeos. En el capítulo 3 se trata el diseño e implementación del algoritmo en dos plataformas: inicialmente en Python 3.6 para la etapa de calibración de parámetros en una computadora de escritorio, y en C++ para las pruebas finales en un teléfono con SO Android. En dicho capítulo también se hace presente consideraciones planteadas para la creación del conjunto de videos de pruebas en Python. Finalmente, en el capítulo 4 se exponen las pruebas y resultados obtenidos de la aplicación del algoritmo, en Python, sobre la base de muestras creadas, y los resultados finales del uso de la aplicación en Android. Para estimar el grado de conformidad de la imagen resultante se hará uso de la métrica de Levenshtein o distancia de edición, la cual señala cuántos caracteres detectados en la imagen compuesta son diferentes a los caracteres del texto original.