Descubra cómo los detectores basados en anclas revolucionan la detección de objetos con una localización precisa, adaptabilidad de escala y aplicaciones en el mundo real.
Los detectores basados en anclajes son una clase fundamental de modelos utilizados en visión por computador (VC) para resolver el problema de la detección de objetos. Estos sistemas se basan en un conjunto predefinido de cuadros delimitadores, conocidos como cajas de anclaje, que actúan como plantillas de referencia en una imagen. En lugar de intentar predecir la ubicación de un objeto a partir de cero, la red calcula cuánto desplazar y escalar estos anclajes fijos para ajustarlos a los objetos de la escena. Este enfoque convierte la compleja compleja tarea de localización en un problema de regresión estructurado, proporcionando un punto de partida estable para que los modelos de aprendizaje profundo (deep learning, DL) aprendan. aprendizaje profundo (DL) para aprender jerarquías jerarquías espaciales.
El flujo de trabajo de un detector basado en anclas consiste en generar una rejilla densa de anclas sobre la imagen de entrada, cada una con con diferentes escalas y relaciones de aspecto para capturar objetos de distintos tamaños y formas. A medida que la imagen pasa por la modelo, se extraen y analizan mapas de características. Para cada posición de anclaje, el cabeza de detección realiza dos predicciones simultáneas:
Durante el entrenamiento del modelo, los algoritmos utilizan una métrica denominada Intersección sobre Unión (IoU) para determinar qué anclas se solapan lo suficiente con objetos conocidos. Sólo las anclas con el mayor IoU se tratan como muestras positivas. Dado que este proceso genera miles de cajas candidatas, es necesario un paso de postprocesamiento conocido como Supresión no máxima (NMS) para eliminar los solapamientos redundantes y conservar sólo la detección más precisa.
Es importante distinguir estos modelos de la moderna generación de detectores sin anclaje. Mientras que los sistemas como el Faster R-CNN original y el Ultralytics YOLOv5 dependen del ajuste manual de las dimensiones los modelos sin anclas predicen directamente los centros o puntos clave de los objetos.
A pesar del auge de nuevos métodos, los detectores basados en anclajes siguen siendo frecuentes en muchos procesos establecidos en los que las formas de los objetos son consistentes y predecibles. de objetos son coherentes y predecibles.
Puede experimentar fácilmente con la detección de objetos utilizando la función ultralytics paquete. Aunque los últimos modelos
son sin anclaje, el marco admite una gran variedad de arquitecturas. El siguiente ejemplo muestra cómo ejecutar
inferencia sobre una imagen utilizando un modelo preentrenado:
from ultralytics import YOLO
# Load a pre-trained object detection model
# Note: YOLOv5 is a classic example of an anchor-based architecture
model = YOLO("yolov5su.pt")
# Perform inference on a local image
results = model("path/to/image.jpg")
# Display the resulting bounding boxes and class labels
results[0].show()
Comprender la mecánica de los detectores basados en anclajes proporciona una base sólida para comprender la evolución de la de la visión por ordenador y las decisiones de diseño algoritmos avanzados como YOLO11 y futuras iteraciones como YOLO26.