¡Sintonice YOLO Vision 2025!
25 de septiembre de 2025
10:00 — 18:00 BST
Evento híbrido
Yolo Vision 2024
Glosario

Cajas de anclaje

Aprenda cómo las cajas de anclaje permiten la detección de objetos basada en anclajes, priors para clasificación, regresión y NMS, con aplicaciones en conducción autónoma y comercio minorista.

Los recuadros de anclaje son un componente fundamental en muchos modelos de detección de objetos basados en anclajes, ya que sirven como un conjunto predefinido de recuadros de referencia con alturas y anchuras específicas. Estos recuadros actúan como conjeturas sobre la posible ubicación y escala de los objetos en una imagen. En lugar de buscar objetos a ciegas, los modelos utilizan estas anclas como puntos de partida, prediciendo desplazamientos para afinar su posición y tamaño hasta que coincidan con los objetos reales. Este enfoque transforma la compleja tarea de localización de objetos en un problema de regresión más manejable, en el que el modelo aprende a ajustar estas plantillas en lugar de generar recuadros desde cero.

Cómo funcionan las cajas de anclaje

El mecanismo principal consiste en colocar en mosaico una imagen con una densa cuadrícula de cajas de anclaje en varias posiciones. En cada posición se utilizan múltiples anclajes con diferentes escalas y relaciones de aspecto para garantizar la detección eficaz de objetos de formas y tamaños diversos. Durante el proceso de entrenamiento del modelo, la columna vertebral del detector extrae primero un mapa de características de la imagen de entrada. A continuación, la cabeza detectora utiliza estas características para realizar dos tareas para cada caja de anclaje:

  • Clasificación: Predice la probabilidad de que una caja de anclaje contenga un objeto de interés, asignando una etiqueta de clase y una puntuación de confianza.
  • Regresión: Calcula los ajustes precisos (o desplazamientos) necesarios para transformar el cuadro de anclaje en un cuadro delimitador final que encierre estrechamente el objeto.

El modelo utiliza métricas como la intersección sobre la unión (IoU) para determinar qué cajas de anclaje coinciden mejor con los objetos reales durante el entrenamiento. Tras la predicción, se aplica un paso de posprocesamiento denominado supresión no máxima (NMS) para eliminar los recuadros redundantes y superpuestos del mismo objeto.

Cajas de anclaje frente a otros conceptos

Es importante distinguir las cajas de anclaje de los términos relacionados en visión por ordenador:

  • Cuadro delimitador: Un cuadro de anclaje es una plantilla predefinida que se utiliza durante el proceso de detección, mientras que un cuadro delimitador es el resultado final, refinado, que localiza con precisión un objeto detectado.
  • Detectores sin anclas: Aunque los modelos basados en anclas, como YOLOv5 y la familia Faster R-CNN, se basan en estos preajustes, las arquitecturas modernas se han inclinado cada vez más por los detectores sin anclas. Modelos como Ultralytics YOLO11 predicen la ubicación de los objetos directamente mediante la identificación de puntos clave o centros, lo que simplifica el diseño del modelo y puede mejorar el rendimiento en objetos con formas poco convencionales. Puede obtener más información sobre las ventajas de un diseño sin anclajes en YOLO11.

Aplicaciones en el mundo real

El enfoque estructurado de las cajas de anclaje las hace eficaces en escenarios en los que los objetos tienen formas y tamaños predecibles.

  1. Conducción autónoma: En las soluciones para el sector de la automoción, los detectores basados en anclajes destacan en la identificación de coches, peatones y señales de tráfico. Las relaciones de aspecto relativamente uniformes de estos objetos se alinean bien con anclajes predefinidos, lo que permite una detección fiable para sistemas desarrollados por empresas como NVIDIA y Tesla.
  2. Análisis del comercio minorista: Para la gestión de inventarios basada en IA, estos modelos pueden escanear eficazmente las estanterías para contar los productos. El tamaño y la forma uniformes de los productos envasados los convierten en candidatos ideales para un enfoque basado en anclajes, lo que ayuda a automatizar el control de existencias y reducir el esfuerzo manual.

Estos modelos suelen desarrollarse utilizando potentes marcos de aprendizaje profundo como PyTorch y TensorFlow. Para seguir aprendiendo, plataformas como DeepLearning.AI ofrecen cursos completos sobre fundamentos de visión por ordenador.

Únete a la comunidad de Ultralytics

Únete al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo

Únete ahora
Enlace copiado al portapapeles