Simulación de proyecto entre cliente (profesor) y empresa (alumnos) para la asignatura Aplicaciones Industriales y Comerciales del Máster Universitario en Visión Artificial.
El cliente nos ha proporcionado una base de datos de imágenes de 5000x5000 píxeles y el groun truth son imágenes binarias con las casas segmentadas. El objetivo de esta tarea es transformar la base de datos en otra con formato Pascal VOC para poder entrenar detectores de objetos. Se deberán transformar los blobs de las imágenes binarias en bounding boxes y, además, dividir las imágenes en parches más pequeños para poder entrenar los modelos de detección.
El detector de objetos ofrece una predicción de bounding boxes para parches de tamaño reducido de la imagen original. El objetivo de esta tarea es mergear las predicciones de todos los parches para reconstruir la imagen completa de alta resolución con todos los bounding boxes. La dificultad está en cómo manejar los bordes de los parches.
Se debe desarrollar un algoritmo que evalúe el rendimiento del sistema completo de detección para una imagen de alta resolución (5000x5000 píxeles). También se desarrollarán test para llevar a cabo pruebas del sistema.