Descubra cómo los detectores basados en anclas revolucionan la detección de objetos con una localización precisa, adaptabilidad a escalas y aplicaciones en el mundo real.
Los detectores basados en anclajes son una clase fundamental de modelos de detección de objetos en visión por ordenador. Estos modelos funcionan utilizando un conjunto predefinido de cajas, conocidas como cajas de anclaje, para identificar y localizar objetos dentro de una imagen. Las cajas de anclaje son esencialmente una rejilla de plantillas con varios tamaños y relaciones de aspecto que se colocan en mosaico a lo largo de la imagen. El modelo predice cómo desplazar y escalar estos anclajes para que coincidan con los recuadros delimitadores de los objetos, junto con una puntuación de confianza que indica la presencia de un objeto. Este enfoque simplifica el problema de la búsqueda de objetos convirtiéndolo en una tarea de regresión y clasificación relativa a estos anclajes fijos.
Algunos ejemplos destacados de arquitecturas basadas en anclas son la familia R-CNN, como Faster R-CNN, y los primeros detectores de una sola etapa como SSD (Single Shot MultiBox Detector) y muchos modelos YOLO, incluido el exitoso Ultralytics YOLOv5.
La idea central de la detección basada en anclas es utilizar un conjunto de cajas de referencia predefinidas como punto de partida. Durante el proceso de formación del modelo, el detector aprende a realizar dos tareas principales para cada cuadro de anclaje:
Estas predicciones las realiza el cabezal de detección del modelo tras procesar las características de la imagen extraídas por la columna vertebral. Dado que un mismo objeto puede ser detectado por varias cajas de anclaje, se utiliza un paso de posprocesamiento denominado supresión no máxima (NMS) para filtrar las detecciones redundantes y conservar sólo la caja que mejor se ajuste. El rendimiento de estos modelos suele evaluarse utilizando métricas como la Precisión Media Media (mAP) y la Intersección sobre Unión (IoU).
En los últimos años, los detectores sin anclas se han convertido en una alternativa muy popular. A diferencia de los modelos basados en anclas, los enfoques sin anclas predicen directamente la ubicación y el tamaño de los objetos, a menudo identificando puntos clave (como centros o esquinas de objetos) o prediciendo distancias desde un punto a los límites del objeto, lo que elimina la necesidad de formas de anclaje predefinidas.
Las principales diferencias son:
Aunque los detectores basados en anclas como YOLOv4 tuvieron mucho éxito, muchas arquitecturas modernas, incluida Ultralytics YOLO11, han adoptado diseños sin anclas para aprovechar sus ventajas en simplicidad y eficiencia. Puede explorar las ventajas de la detección sin anclajes en YOLO11 y ver comparaciones entre distintos modelos de YOLO.
Los detectores basados en anclas se utilizan ampliamente en diversas aplicaciones en las que los objetos tienen formas y tamaños relativamente estándar.
El desarrollo y despliegue de modelos de detección de objetos, basados o no en anclajes, implica el uso de marcos de trabajo como PyTorch o TensorFlow y bibliotecas como OpenCV. Plataformas como Ultralytics HUB ofrecen flujos de trabajo optimizados para el entrenamiento de modelos personalizados, la gestión de conjuntos de datos y el despliegue de soluciones, y admiten diversas arquitecturas de modelos. Para seguir aprendiendo, recursos como Papers With Code enumeran los modelos más avanzados, y cursos de plataformas como DeepLearning.AI cubren conceptos básicos.