Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Detectores Basados en Anclas (Anchor-Based)

Descubra cómo los detectores basados en anclas revolucionan la detección de objetos con una localización precisa, adaptabilidad de escala y aplicaciones en el mundo real.

Los detectores basados en anclajes son una clase fundamental de modelos utilizados en visión por computador (VC) para resolver el problema de la detección de objetos. Estos sistemas se basan en un conjunto predefinido de cuadros delimitadores, conocidos como cajas de anclaje, que actúan como plantillas de referencia en una imagen. En lugar de intentar predecir la ubicación de un objeto a partir de cero, la red calcula cuánto desplazar y escalar estos anclajes fijos para ajustarlos a los objetos de la escena. Este enfoque convierte la compleja compleja tarea de localización en un problema de regresión estructurado, proporcionando un punto de partida estable para que los modelos de aprendizaje profundo (deep learning, DL) aprendan. aprendizaje profundo (DL) para aprender jerarquías jerarquías espaciales.

Mecanismos de detección basados en anclajes

El flujo de trabajo de un detector basado en anclas consiste en generar una rejilla densa de anclas sobre la imagen de entrada, cada una con con diferentes escalas y relaciones de aspecto para capturar objetos de distintos tamaños y formas. A medida que la imagen pasa por la modelo, se extraen y analizan mapas de características. Para cada posición de anclaje, el cabeza de detección realiza dos predicciones simultáneas:

  1. Clasificación: El modelo asigna una puntuación de probabilidad que indica si el ancla contiene un clase específica de objeto o es simplemente ruido de fondo.
  2. Regresión de cajas delimitadoras: El modelo predice valores de desplazamiento (coordenadas para el centro, la anchura y la altura) para ajustar las dimensiones del anclaje de modo que coincidan con la realidad sobre el terreno. altura) para ajustar las dimensiones del ancla de modo que coincida con la verdad sobre el terreno del terreno.

Durante el entrenamiento del modelo, los algoritmos utilizan una métrica denominada Intersección sobre Unión (IoU) para determinar qué anclas se solapan lo suficiente con objetos conocidos. Sólo las anclas con el mayor IoU se tratan como muestras positivas. Dado que este proceso genera miles de cajas candidatas, es necesario un paso de postprocesamiento conocido como Supresión no máxima (NMS) para eliminar los solapamientos redundantes y conservar sólo la detección más precisa.

Arquitecturas basadas en anclajes frente a arquitecturas sin anclajes

Es importante distinguir estos modelos de la moderna generación de detectores sin anclaje. Mientras que los sistemas como el Faster R-CNN original y el Ultralytics YOLOv5 dependen del ajuste manual de las dimensiones los modelos sin anclas predicen directamente los centros o puntos clave de los objetos.

  • Basado en anclajes: Requiere definir hiperparámetros para tamaños y proporciones de anclaje, que pueden ser sensibles a conjuntos de datos específicos. a conjuntos de datos específicos. Son históricamente robustos para objetos estándar.
  • Sin anclajes: elimina la necesidad de cajas preestablecidas, lo que simplifica la arquitectura y reduce la carga computacional. la sobrecarga computacional. El estado del arte Ultralytics YOLO11 utiliza un enfoque sin anclajes para conseguir una velocidad y flexibilidad superiores, especialmente para objetos con geometrías irregulares. Puede obtener más información sobre las ventajas del diseño sin anclajes de YOLO11 en nuestro blog.

Aplicaciones en el mundo real

A pesar del auge de nuevos métodos, los detectores basados en anclajes siguen siendo frecuentes en muchos procesos establecidos en los que las formas de los objetos son consistentes y predecibles. de objetos son coherentes y predecibles.

  • Conducción autónoma: En el desarrollo de vehículos autónomos, los sistemas deben detect con detect coches, camiones y señales de tráfico. Dado que los vehículos suelen mantener relaciones de aspecto uniformes, los modelos son eficaces para las pilas de percepción utilizadas por líderes del sector como Waymo y Mobileye.
  • Gestión de inventarios minoristas: Para AI en el comercio minorista, las cámaras supervisan las estanterías para track niveles de existencias. los niveles de existencias. Productos como las cajas de cereales o las latas de bebidas tienen formas estandarizadas que se alinean perfectamente con plantillas de anclaje ajustadas. plantillas de anclaje, lo que permite un recuento y un seguimiento de objetos.

Aplicación con Ultralytics

Puede experimentar fácilmente con la detección de objetos utilizando la función ultralytics paquete. Aunque los últimos modelos son sin anclaje, el marco admite una gran variedad de arquitecturas. El siguiente ejemplo muestra cómo ejecutar inferencia sobre una imagen utilizando un modelo preentrenado:

from ultralytics import YOLO

# Load a pre-trained object detection model
# Note: YOLOv5 is a classic example of an anchor-based architecture
model = YOLO("yolov5su.pt")

# Perform inference on a local image
results = model("path/to/image.jpg")

# Display the resulting bounding boxes and class labels
results[0].show()

Comprender la mecánica de los detectores basados en anclajes proporciona una base sólida para comprender la evolución de la de la visión por ordenador y las decisiones de diseño algoritmos avanzados como YOLO11 y futuras iteraciones como YOLO26.

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora