Segmentación semántica de escenas urbanas de la provincia de Huamanga
No hay miniatura disponible
Fecha
2024-09-10
Autores
Título de la revista
ISSN de la revista
Título del volumen
Editor
Pontificia Universidad Católica del Perú
DOI
Resumen
La presente tesis se enfoca en la identificación y clasificación de objetos en escenas urbanas de
la provincia de Huamanga, explorando un entorno diferente al de las ciudades desarrolladas y
otras bases de datos existentes. Se estudiarán las escenas urbanas de Huamanga para segmentar
imágenes en 7 clases de datos: personas, vehículos, motociclistas, edificios, veredas, pistas y
otros, que incluyen detalles de cielo y cables de energía eléctrica. El enfoque principal de la
tesis estará centrado en la visión por computadora, específicamente en la segmentación
semántica para la clasificación de objetos. Para ello, se emplearán arquitecturas de aprendizaje
profundo pre-entrenadas adaptadas a Deeplabv3+, y se utilizarán imágenes de la provincia de
Huamanga como base de datos local.
La investigación se inicia con un análisis del estado del arte, destacando la importancia de la
clasificación de objetos en escenas urbanas y los beneficios del aprendizaje profundo en
comparación con métodos tradicionales. Se enfatiza la necesidad de utilizar bases de datos
locales sobre las existentes, así como la base teórica para la clasificación de imágenes locales
utilizando Deeplabv3+ y redes de aprendizaje profundo mediante la transferencia de
aprendizaje. Posteriormente, se describe el diseño, la recopilación y el enfoque de la base de
datos locales en comparación con conjuntos de datos como Imagenet y CityScapes, utilizando
la arquitectura Deeplabv3+ junto con redes de aprendizaje profundo en los datos locales.
Finalmente, se presentan los resultados basados en el incremento del número de datos,
analizando la precisión, el Índice de Jaccard (IoU) y el mBFScore tanto a nivel global como
por clase, junto con un análisis comparativo con la base de datos Cityscapes. Se proporcionan
tablas sumarias que verifican los resultados de cada red de aprendizaje profundo y se propone
hardware para dispositivos capaces de ejecutar tareas de segmentación semántica.
Descripción
Palabras clave
Procesamiento de imágenes digitales, Visión por computadoras, Aprendizaje automático (Inteligencia artificial)
Citación
Colecciones
item.page.endorsement
item.page.review
item.page.supplemented
item.page.referenced
Licencia Creative Commons
Excepto se indique lo contrario, la licencia de este artículo se describe como info:eu-repo/semantics/openAccess