Descubra cómo los detectores basados en anclajes utilizan cuadros delimitadores predefinidos para la detección de objetos. Conozca sus mecanismos básicos, casos de uso en el mundo real y cómo se comparan con el moderno y más rápido Ultralytics .
Los detectores basados en anclajes son una clase fundamental de modelos de detección de objetos en la visión por computadora que utilizan un conjunto de cuadros delimitadores predefinidos para localizar y classify . En lugar de intentar predecir las coordenadas de un objeto partiendo de cero, estos sistemas comienzan con plantillas de referencia fijas conocidas como cuadros de anclaje. A continuación, se entrena la red neuronal para determinar cuál de estas plantillas se ajusta mejor a un objeto de la imagen y para calcular los desplazamientos específicos (ajustes en la posición y el tamaño) necesarios para alinear perfectamente el ancla con el objetivo. Este enfoque transforma el difícil problema de la predicción de coordenadas arbitrarias en una tarea de regresión más estable, lo que supuso un avance clave en el desarrollo de las primeras arquitecturas de aprendizaje profundo (DL) como Faster R-CNN y SSD.
La operación central de un detector basado en anclajes gira en torno a la división de la imagen de entrada en una cuadrícula densa. En cada celda de esta cuadrícula, el modelo genera múltiples cuadros de anclaje con diferentes escalas y relaciones de aspecto para tener en cuenta las diferentes formas de los objetos, como peatones altos o vehículos anchos. A medida que los datos de la imagen pasan por la columna vertebral del modelo , la red extrae características ricas para realizar dos tareas simultáneas:
x, y coordenadas, anchura y altura, lo que da como resultado un ajuste perfecto.
bounding box.
Durante el entrenamiento del modelo, estos detectores utilizan una métrica denominada Intersección sobre Unión (IoU) para hacer coincidir los anclajes predefinidos con las etiquetas de verdad fundamental proporcionadas en el conjunto de datos. Los anclajes con un alto solapamiento se tratan como muestras positivas. Dado que este proceso genera miles de detecciones potenciales, se aplica un algoritmo de filtrado conocido como supresión no máxima (NMS) durante la inferencia para eliminar las cajas redundantes y conservar solo la predicción más precisa para cada objeto.
Aunque los métodos basados en anclajes establecieron el estándar durante años, el campo ha evolucionado hacia los detectores sin anclajes. Comprender la distinción es vital para los profesionales modernos.
La lógica basada en anclajes sigue siendo relevante en muchos sistemas de producción heredados y especializados en los que las formas de los objetos son predecibles y consistentes.
Si bien los últimos modelos YOLO26 utilizan cabezales sin anclajes para obtener un rendimiento superior, la interfaz para ejecutar la detección sigue siendo la misma. La Ultralytics y Python abstraen la complejidad de si un modelo utiliza anclajes o puntos centrales, lo que permite a los usuarios centrarse en los resultados.
A continuación se explica cómo cargar un modelo y ejecutar la inferencia para detect , un flujo de trabajo que se aplica independientemente de la arquitectura de anclaje subyacente:
from ultralytics import YOLO
# Load the YOLO26 model (optimized for speed and accuracy)
model = YOLO("yolo26n.pt")
# Run inference on an image source
# The model handles internal logic (anchor-based or anchor-free) automatically
results = model.predict("https://ultralytics.com/images/bus.jpg")
# Display the first result with bounding boxes
results[0].show()
Para profundizar en su comprensión de los mecanismos de detección, explore la investigación fundamental sobre Faster R-CNN, que introdujo la Red de Propuestas de Regiones (RPN), o lea sobre el Detector MultiBox de Disparo Único (SSD), que optimizó la detección basada en anclajes para aumentar la velocidad. Para obtener una visión más amplia del campo, el COCO sirve como referencia estándar para evaluar tanto los modelos basados en anclajes como los que no lo están. Además, los cursos avanzados de Coursera suelen cubrir los detalles matemáticos de la regresión de cajas y la coincidencia de anclajes.