Resumen:
El etiquetado o la anotación de datos para entrenar modelos de clasificación implica el manejo de grandes cantidades de información, además es una tarea ardua y tediosa que representa uno de los cuellos de botella en el entrenamiento de sistemas de aprendizaje automático.
En este trabajo se propone mejorar el etiquetado o la anotación de plantas de brócoli de una manera semiautomática, lo que incrementará la disponibilidad de datos para la experimentación y evaluación de sistemas de detección y localización automáticos. Para ello, se utilizó un algoritmo de extracción de grupos basado en distancia Euclidiana y se realizó la estimación de características para cada nuevo grupo, lo que permite determinar la similitud entre grupos ya detectados y grupos extraídos de
observaciones posteriores. Las pruebas realizadas en conjuntos
de datos tomados en campos de cultivo de brócoli del Reino Unido mostraron que la detección y anotación semiautomática de brócoli permite reducir el tiempo que se requiere en el etiquetado de datos.