Yolo Vision Shenzhen
Shenzhen
Únete ahora
Glosario

Cajas de anclaje

Aprenda cómo las cajas de anclaje permiten la detección de objetos basada en anclajes, priors para clasificación, regresión y NMS, con aplicaciones en conducción autónoma y comercio minorista.

Las cajas de anclaje son un concepto básico en la arquitectura de muchos modelos de detección de objetos. modelos de detección de objetos, actuando como predefinidas para predecir la ubicación y el tamaño de los objetos. En lugar de escanear una imagen en busca de objetos de dimensiones arbitrarias, el modelo utiliza estas formas fijas -definidas por alturas y anchuras específicas- como puntos de partida, o priores. Este enfoque simplifica el proceso de aprendizaje transformando la difícil tarea de predecir las coordenadas absolutas en una regresión más manejable. en un problema de regresión más manejable en el que la red aprende a ajustar, o "compensar", estas plantillas para que se ajusten a los objetos reales. para ajustarse a los objetos reales. Esta técnica técnica ha sido fundamental para el éxito de arquitecturas populares como la familia Faster R-CNN y los primeros detectores de una sola etapa.

Funcionamiento de las cajas de anclaje

El mecanismo de las cajas de anclaje consiste en embaldosar la imagen de entrada con una cuadrícula densa de centros. En cada celda de la cuadrícula se generan varias cajas de anclaje con diferentes para acomodar objetos de diferentes formas, como peatones altos o vehículos anchos. Durante la fase de Durante la fase de entrenamiento del modelo, el sistema objetos reales utilizando una métrica denominada Intersección sobre Unión (IoU). Los anclajes que se solapan significativamente con un objeto objetivo se etiquetan como muestras positivas.

La columna vertebral del detector extrae características de la imagen, que la cabeza detectora utiliza para realizar dos tareas paralelas para cada ancla positiva:

  • Clasificación: El modelo predice la probabilidad de que el anclaje contenga una clase específica de objeto asignando una puntuación de confianza.
  • Regresión de cajas: La red calcula los desplazamientos de coordenadas precisos necesarios para remodelar el ancla en un cuadro delimitador final que encierra estrechamente el objeto.

Para tratar las predicciones superpuestas de un mismo objeto, se utiliza un paso de posprocesamiento conocido como Supresión no máxima (NMS) filtra cajas redundantes, reteniendo sólo la de mayor confianza. Marcos como PyTorch y TensorFlow proporcionan las herramientas computacionales implementar estas complejas operaciones de forma eficiente.

Anclajes frente a conceptos relacionados

Para entender los cuadros de anclaje hay que distinguirlos de términos similares dentro de la visión por ordenador (CV).

  • Cajas de anclaje frente a cajas delimitadoras: Un cuadro de anclaje es una plantilla teórica y fija que se utiliza como hipótesis durante el procesamiento. Un cuadro delimitador es el resultado final refinado que contiene las coordenadas del objeto detectado.
  • Basado en anclas vs. Sin anclas: Los detectores tradicionales tradicionales basados en anclas, como YOLOv5se basan en estos preajustes manuales. En cambio, los detectores detectores sin anclaje, como Ultralytics YOLO11predicen directamente directamente. Este cambio simplifica el diseño del modelo al eliminar la necesidad de ajustar los hiperparámetros relacionados con las dimensiones de anclaje. ancla, lo que suele mejorar la generalización en conjuntos de datos como COCO.

Aplicaciones en el mundo real

La naturaleza estructurada de las cajas de anclaje las hace especialmente eficaces en entornos en los que las formas de los objetos son consistentes y predecibles.

  1. Conducción autónoma: Los sistemas desarrollados para vehículos autónomos se basan en la detección objetos estándar como coches, camiones y señales de tráfico. Dado que estos objetos tienen relaciones de aspecto relativamente fijas, las cajas de anclaje pueden ajustarse para captarlos con eficacia. Empresas como Waymo utilizan sofisticados conductos de detección para garantizar la seguridad en complejos escenarios de tráfico complejos.
  2. Gestión de inventarios minoristas: En analítica minorista, los sistemas de visión supervisan las estanterías para detect los niveles de existencias. Los productos envasados suelen tener formas uniformes, lo que permite que los modelos basados en anclas cuenten con precisión los artículos e identifiquen los productos agotados. e identificar los productos agotados. Esta automatización permite gestión de inventario basada en IA, reduciendo el trabajo manual.

Ejemplo de código

Mientras que los modelos modernos, como YOLO11 , no tienen anclajes, las iteraciones anteriores, como YOLOv5 , utilizan cajas de anclaje. El sitio ultralytics abstrae esta complejidad, lo que permite a los usuarios ejecutar la inferencia sin configurar manualmente los anclajes. El siguiente ejemplo muestra la carga de un modelo preentrenado para detect objetos:

from ultralytics import YOLO

# Load a pretrained YOLOv5 model (anchor-based architecture)
model = YOLO("yolov5su.pt")

# Run inference on a static image from the web
results = model("https://ultralytics.com/images/bus.jpg")

# Display the detected bounding boxes
results[0].show()

Para los interesados en los fundamentos matemáticos de estos sistemas, plataformas educativas como Coursera y DeepLearning.AI ofrecen cursos en profundidad sobre redes neuronales convolucionales y detección de objetos.

Únase a la comunidad Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora