Segmentación de cultivos de uva de mesa a partir de imágenes aéreas y satelitales usando algoritmos de aprendizaje profundo

Villarroel Segovia, Jamir Enrique

Acceso cerrado

Date

2024-10-29

Author

Villarroel Segovia, Jamir Enrique

Acceso a Texto completo

URI

http://hdl.handle.net/20.500.12404/29253

Abstract

La teledetección ha ayudado a mejorar la gestión y el riego de los cultivos en los últimos años. A través de esta técnica, se ha logrado identificar aquellos cultivos de interés y extraer información de estos para el diagnóstico de enfermedades, la predicción de rendimiento de lotes de cultivos, el mapeo de cultivos y en la planificación de actividades de exportación. La uva es uno de los productos de agroexportación más importantes de Perú, generando grandes ingresos y aumentando anualmente. Si bien, la identificación de cultivos empezó a realizarse a partir de encuestas agrarias, luego se desarrolló técnicas basadas en algoritmos de aprendizaje automático tales como Random Forest (RF), Support Vector Machine (SVM), Artificial Neural Networks (ANN) para identificar diversos tipos de cultivos, entre ellos la uva, a nivel mundial. Estas técnicas presentaban buenos resultados; no obstante, el uso de algoritmos de aprendizaje profundo basados en segmentación semántica se popularizó por obtener mejores resultados que los anteriores y se comenzaron a emplear en los últimos años para la identificación de muchos cultivos. En esta tesis, se planteó identificar de forma automatizada los cultivos de uva de mesa. Para ello, se realizó la comparación de las arquitecturas U-Net, SegNet y DeepLabV3+ que realizan técnicas de segmentación semántica. Cada red fue entrenada y evaluada utilizando dos conjuntos de datos conformados por imágenes aéreas y satelitales de las zonas de interés. Asimismo, se calcularon los índices NDVI y SAVI en cada imagen aérea y satelital del conjunto de datos de entrenamiento, validación y prueba. Posteriormente, se añadió a cada imagen ambas bandas calculadas como una sexta y séptima capa adicional, ya que las imágenes aéreas y satelitales del conjunto de datos formado solo presentan 5 bandas espectrales: rojo, verde, azul, infrarrojo cercano y borde rojo. Se realizó el proceso de etiquetado, gracias a la información brindada por la empresa Vitícola S.A.C, con ayuda del NDVI para separar aquellas imágenes que presentan cultivos de uva en una etapa fenológica tardía y temprana en cada conjunto de datos. Con el fin de incrementar la cantidad de datos de entrada a la red, se utilizó la técnica de extracción de parches aleatorios, y se aplicaron procesos de reflexión y rotación para el entrenamiento de las 3 redes mencionadas. Finalmente, se compararon los resultados de prueba de estos algoritmos de clasificación y se determinó que tanto en los conjuntos de datos de imágenes aéreas con una etapa fenológica temprana y tardía, las redes SegNet y DeeplabV3+ fueron las que obtuvieron mejor desempeño con una precisión global de 95.21% y una mIoU de 0.8280, y una precisión global de 93.40 % y una mIoU de 0.7555 respectivamente. Asimismo, la red DeepLabV3+ obtuvo mejor desempeño promedio en el conjunto de datos de imágenes satelitales con una precisión global de 93.84 % y un mIoU de 0.8389.

Temas

Viticultura--Perú--Fotografías aéreas
Aprendizaje profundo (Aprendizaje automático)
Algoritmos computacionales

Collections

Ingeniería Electrónica