Uso de redes neuronales convolucionales para la detección remota de frutos con cámaras RGB-D

التفاصيل البيبلوغرافية
العنوان: Uso de redes neuronales convolucionales para la detección remota de frutos con cámaras RGB-D
المؤلفون: Joan Ramón Rosell Polo, Josep Ramon Morros, J. Ruiz Hidalgo, Verónica Vilaplana, J. Gené Mola, Eduard Gregorio
المساهمون: Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Universitat Politècnica de Catalunya. GPI - Grup de Processament d'Imatge i Vídeo
المصدر: Zaguán. Repositorio Digital de la Universidad de Zaragoza
instname
سنة النشر: 2019
مصطلحات موضوعية: Neural networks (Computer science), Teledetecció, Fructicultura, Enginyeria de la telecomunicació::Radiocomunicació i exploració electromagnètica::Teledetecció [Àrees temàtiques de la UPC], Redes neuronales convolucionales, Xarxes neuronals (Informàtica), RGB-D, Robótica agrícola, Remote sensing, Informàtica::Robòtica [Àrees temàtiques de la UPC], Cámaras de profundidad, Detección de frutos, Fruit-culture
الوصف: La detección remota de frutos será una herramienta indispensable para la gestión agronómica optimizada y sostenible de las plantaciones frutícolas del futuro, con aplicaciones en previsión de cosecha, robotización de la recolección y elaboración de mapas de producción. Este trabajo propone el uso de cámaras de profundidad RGB-D para la detección y la posterior localización 3D de los frutos. El material utilizado para la adquisición de datos consiste en una plataforma terrestre autopropulsada equipada con dos sensores Kinect v2 de Microsoft y un sistema de posicionamiento RTK-GNSS. Con este equipo se escanearon 3 filas de manzanos Fuji de una explotación comercial. El conjunto de datos adquiridos está compuesto por 110 capturas que contienen un total de 12,838 manzanas Fuji. La detección de frutos se realizó mediante los datos RGB (imágenes de color proporcionadas por el sensor). Para ello, se implementó y se entrenó la red neuronal convolucional de detección de objetos Faster R-CNN, la cual está compuesta por dos módulos: red de propuesta de regiones de interés y red de clasificación. Ambos módulos comparten las primeras capas convolucionales siguiendo el modelo VGG-16 pre-entrenado con la base de datos ImageNet. Los resultados de test muestran un porcentaje de detección del 91.4% de los frutos con un 15.9% de falsos positivos (F1-score = 0.876). La evaluación cualitativa de las detecciones muestra que los falsos positivos corresponden a zonas de la imagen que presentan un patrón muy similar a una manzana, donde, incluso a percepción del ojo humano, es difícil de determinar si hay o no manzana. Por otro lado, las manzanas no detectadas corresponden a aquellas que estaban ocultas casi en su totalidad por otros órganos vegetativos (hojas o ramas) o a manzanas cortadas por los márgenes de la imagen. De los resultados experimentales se concluye que el sensor Kinect v2 tiene un gran potencial para la detección y localización 3D de frutos. La principal limitación del sistema es que el rendimiento del sensor de profundidad se ve afectado en condiciones de alta iluminación. Este trabajo ha sido parcialmente financiado por la Secretaria d’Universitats i Recerca del Departament d’Empresa i Coneixement de la Generalitat de Catalunya, el Ministerio de Economía y Competitividad de España, y the European Regional Development Fund (ERDF), mediante los proyectos 2017 SGR 646, AGL2013-48297-C2-2-R, MALEGRA TEC2016-75976-R. Se agradece al Ministerio de Educación de España por la beca pre-doctoral de J. Gené (FPU15/03355).
وصف الملف: application/pdf
URL الوصول: https://explore.openaire.eu/search/publication?articleId=doi_dedup___::341716841c3e53264aa2336b3c42834c
http://zaguan.unizar.es/record/84404
حقوق: OPEN
رقم الأكسشن: edsair.doi.dedup.....341716841c3e53264aa2336b3c42834c
قاعدة البيانات: OpenAIRE