Etiquetado automático de objetos en imágenes panorámicas
Labeling Objects in Panoramic Images
Autor
Navarro Chamucero, Matthieu
Campo Charris, Robinson Luis
Vallejo Morales, Luis Alejandro
Fecha
2024-05-14Resumen
En este proyecto, nos enfocamos en el desarrollo de un método para el etiquetado automático de objetos en imágenes panorámicas, con el objetivo de minimizar la intervención humana. Empleamos modelos de aprendizaje profundo, incluyendo YOLOv8 y Fast R-CNN, y los combinamos con estrategias avanzadas de transfer learning y fine-tuning. Nuestro enfoque se centró en optimizar la eficiencia del proceso de etiquetado sin comprometer la precisión en el etiquetado de objetos. Para ello, realizamos diversas evaluaciones del rendimiento del sistema en diversos escenarios urbanos, considerando la complejidad y la variabilidad de las imágenes capturadas. Los resultados obtenidos demuestran que nuestra metodología logra una reducción significativa en el tiempo requerido para el etiquetado, lo cual tiene importantes implicaciones en términos de eficiencia y productividad. Además, destacamos la robustez y la escalabilidad de nuestro enfoque, lo que lo hace aplicable a una amplia gama de aplicaciones en el campo de la visión por computadora. En resumen, nuestro proyecto representa un avance significativo en la automatización del etiquetado de objetos en imágenes panorámicas, ofreciendo una solución más eficiente para abordar los desafíos asociados con esta tarea. In this project, we focus on the development of a method for automatic labeling of objects in panoramic images, with the aim of minimizing human intervention. We employ deep learning models, including YOLOv8 and Fast R-CNN, and combine them with advanced transfer learning and fine-tuning strategies. Our focus was on optimizing the efficiency of the labeling process without compromising the accuracy of object labeling. To do this, we carried out various evaluations of the system's performance in various urban scenarios, considering the complexity and variability of the captured images. The results obtained demonstrate that our methodology achieves a significant reduction in the time required for labeling, which has important implications in terms of efficiency and productivity. Furthermore, we highlight the robustness and scalability of our approach, making it applicable to a wide range of applications in the field of computer vision. In summary, our project represents a significant advance in the automation of object labeling in panoramic images, offering a more efficient solution to address the challenges associated with this task.