Segmentación de cultivos de uva de mesa a partir de imágenes aéreas y satelitales usando algoritmos de aprendizaje profundo
Acceso a Texto completo
Abstract
La teledetección ha ayudado a mejorar la gestión y el riego de los cultivos en los últimos años.
A través de esta técnica, se ha logrado identificar aquellos cultivos de interés y extraer
información de estos para el diagnóstico de enfermedades, la predicción de rendimiento de
lotes de cultivos, el mapeo de cultivos y en la planificación de actividades de exportación. La
uva es uno de los productos de agroexportación más importantes de Perú, generando grandes
ingresos y aumentando anualmente. Si bien, la identificación de cultivos empezó a realizarse a
partir de encuestas agrarias, luego se desarrolló técnicas basadas en algoritmos de aprendizaje
automático tales como Random Forest (RF), Support Vector Machine (SVM), Artificial Neural
Networks (ANN) para identificar diversos tipos de cultivos, entre ellos la uva, a nivel mundial.
Estas técnicas presentaban buenos resultados; no obstante, el uso de algoritmos de aprendizaje
profundo basados en segmentación semántica se popularizó por obtener mejores resultados que
los anteriores y se comenzaron a emplear en los últimos años para la identificación de muchos
cultivos. En esta tesis, se planteó identificar de forma automatizada los cultivos de uva de mesa.
Para ello, se realizó la comparación de las arquitecturas U-Net, SegNet y DeepLabV3+ que
realizan técnicas de segmentación semántica. Cada red fue entrenada y evaluada utilizando dos
conjuntos de datos conformados por imágenes aéreas y satelitales de las zonas de interés.
Asimismo, se calcularon los índices NDVI y SAVI en cada imagen aérea y satelital del
conjunto de datos de entrenamiento, validación y prueba. Posteriormente, se añadió a cada
imagen ambas bandas calculadas como una sexta y séptima capa adicional, ya que las imágenes
aéreas y satelitales del conjunto de datos formado solo presentan 5 bandas espectrales: rojo,
verde, azul, infrarrojo cercano y borde rojo. Se realizó el proceso de etiquetado, gracias a la
información brindada por la empresa Vitícola S.A.C, con ayuda del NDVI para separar aquellas
imágenes que presentan cultivos de uva en una etapa fenológica tardía y temprana en cada
conjunto de datos. Con el fin de incrementar la cantidad de datos de entrada a la red, se utilizó
la técnica de extracción de parches aleatorios, y se aplicaron procesos de reflexión y rotación
para el entrenamiento de las 3 redes mencionadas. Finalmente, se compararon los resultados de
prueba de estos algoritmos de clasificación y se determinó que tanto en los conjuntos de datos
de imágenes aéreas con una etapa fenológica temprana y tardía, las redes SegNet y DeeplabV3+
fueron las que obtuvieron mejor desempeño con una precisión global de 95.21% y una mIoU
de 0.8280, y una precisión global de 93.40 % y una mIoU de 0.7555 respectivamente.
Asimismo, la red DeepLabV3+ obtuvo mejor desempeño promedio en el conjunto de datos de
imágenes satelitales con una precisión global de 93.84 % y un mIoU de 0.8389.