Anchor Boxes

Aprende cómo los "anchor boxes" actúan como plantillas de referencia para la detección de objetos. Descubre cómo mejoran la precisión y cómo modelos como YOLO26 de Ultralytics utilizan diseños sin anclas.

Las cajas de anclaje son rectángulos de referencia predefinidos con relaciones de aspecto y escalas específicas que se colocan sobre una imagen para ayudar a los modelos de detección de objetos a localizar y clasificar objetos. En lugar de pedirle a una red neuronal que prediga el tamaño y la posición exacta de un objeto desde cero (lo cual puede ser inestable debido a la gran variedad de formas de los objetos), el modelo utiliza estas plantillas fijas como punto de partida. Al aprender a predecir cuánto ajustar, o "regresar", estas cajas iniciales para que se ajusten a la verdad fundamental, el sistema puede lograr una convergencia más rápida y una mayor precisión. Esta técnica transformó fundamentalmente el campo de la visión artificial (CV) al simplificar la compleja tarea de la localización en un problema de optimización más manejable.

Link to this sectionEl mecanismo de las cajas de anclaje#

En los detectores basados en anclajes clásicos, la imagen de entrada se divide en una cuadrícula de celdas. En cada ubicación de celda, la red genera múltiples cajas de anclaje con diferentes geometrías. Por ejemplo, para detectar simultáneamente a un peatón alto y a un coche ancho, el modelo podría proponer una caja alta y estrecha y una caja corta y ancha en el mismo punto central.

Durante el entrenamiento del modelo, estos anclajes se comparan con los objetos reales utilizando una métrica llamada Intersección sobre Unión (IoU). Los anclajes que se superponen significativamente con un objeto etiquetado se designan como muestras "positivas". La red aprende entonces dos tareas paralelas:

Clasificación: Asigna una puntuación de probabilidad al anclaje, indicando la probabilidad de que contenga una clase específica (por ejemplo, "perro" o "bicicleta"). Esto utiliza objetivos estándar de aprendizaje supervisado como la pérdida de entropía cruzada.
Regresión de cajas: Calcula los valores de desplazamiento precisos (cambios de coordenadas y factores de escala) necesarios para transformar el anclaje genérico en una caja delimitadora de ajuste preciso.

Este enfoque permite que el modelo maneje múltiples objetos de diferentes tamaños situados cerca unos de otros, ya que cada objeto puede asignarse al anclaje que mejor se adapte a su forma.

Link to this sectionAplicaciones en el mundo real#

Aunque las arquitecturas más nuevas se están moviendo hacia diseños sin anclajes, las cajas de anclaje siguen siendo vitales en muchos sistemas de producción establecidos donde las características de los objetos son predecibles.

Gestión minorista y de inventario: En las soluciones minoristas basadas en IA, las cámaras monitorizan el stock de las estanterías. Dado que productos como cajas de cereales o latas de refresco tienen dimensiones estandarizadas, las cajas de anclaje pueden ajustarse a estas relaciones de aspecto específicas. Este conocimiento previo ayuda al modelo a mantener un recall alto incluso en entornos desordenados.
Conducción autónoma: Las pilas de percepción en vehículos autónomos dependen de la detección de peatones, vehículos y señales de tráfico. Debido a que un coche visto desde la distancia tiene un perfil de forma relativamente consistente en comparación con la carretera, el uso de anclajes adaptados a estas formas garantiza un seguimiento de objetos y una estimación de distancia robustos.

Link to this sectionBasado en anclajes frente a sin anclajes#

Es importante distinguir entre los métodos tradicionales basados en anclajes y los detectores sin anclajes modernos.

Basado en anclajes: Los modelos como el Faster R-CNN original o las primeras versiones de YOLO (por ejemplo, YOLOv5) utilizan estas plantillas predefinidas. Son robustos, pero a menudo requieren un ajuste manual de hiperparámetros (tamaños/relaciones de anclaje) o algoritmos de agrupamiento como el agrupamiento k-means para adaptarse a nuevos conjuntos de datos.
Sin anclajes: Los modelos avanzados, incluido YOLO26, suelen emplear enfoques sin anclajes o de extremo a extremo. Estas redes predicen centros de objetos o puntos clave directamente, eliminando la necesidad de configuración manual de anclajes. Esto simplifica la arquitectura y acelera la inferencia al eliminar el cálculo requerido para procesar miles de anclajes de fondo vacíos.

Link to this sectionEjemplo: Acceso a la información de anclaje#

Aunque las API de alto nivel modernas, como la Plataforma Ultralytics, abstraen estos detalles durante el entrenamiento, entender los anclajes es útil cuando se trabaja con arquitecturas de modelos más antiguas o se analizan archivos de configuración de modelos. El siguiente fragmento demuestra cómo cargar un modelo e inspeccionar su configuración, donde normalmente se definirían los ajustes de anclaje (si están presentes).

from ultralytics import YOLO

# Load a pre-trained YOLO model (YOLO26 is anchor-free, but legacy configs act similarly)
model = YOLO("yolo26n.pt")

# Inspect the model's stride, which relates to grid cell sizing in detection
print(f"Model strides: {model.model.stride}")

# For older anchor-based models, anchors might be stored in the model's attributes
# Modern anchor-free models calculate targets dynamically without fixed boxes
if hasattr(model.model, "anchors"):
    print(f"Anchors: {model.model.anchors}")
else:
    print("This model architecture is anchor-free.")

Link to this sectionDesafíos y consideraciones#

Aunque son efectivas, las cajas de anclaje introducen complejidad. La gran cantidad de anclajes generados (a menudo decenas de miles por imagen) crea un problema de desequilibrio de clases, ya que la mayoría de los anclajes cubren solo el fondo. Técnicas como la Focal Loss se utilizan para mitigar esto reduciendo el peso de los ejemplos de fondo fáciles. Además, la salida final generalmente requiere Supresión de no máximos (NMS) para filtrar las cajas superpuestas redundantes, asegurando que solo permanezca la detección con mayor confianza para cada objeto.

Anchor Boxes

Link to this sectionEl mecanismo de las cajas de anclaje#

Link to this sectionAplicaciones en el mundo real#

Link to this sectionBasado en anclajes frente a sin anclajes#

Link to this sectionEjemplo: Acceso a la información de anclaje#

Link to this sectionDesafíos y consideraciones#

Explore solutions

IA en robótica

IA en logística

IA en el sector minorista

IA en la atención sanitaria

IA en la fabricación

IA en automoción

IA en agricultura

IA en robótica

IA en logística

IA en el sector minorista

IA en la atención sanitaria

IA en la fabricación

IA en automoción

IA en agricultura

IA en robótica

IA en logística

IA en el sector minorista

IA en la atención sanitaria

IA en la fabricación

IA en automoción

IA en agricultura

¡Construyamos juntos el futuro de la IA!