Glosario

Detectores basados en anclajes

Descubra cómo los detectores basados en anclas revolucionan la detección de objetos con una localización precisa, adaptabilidad a escalas y aplicaciones en el mundo real.

Los detectores basados en anclajes son una clase fundamental de modelos de detección de objetos en visión por ordenador. Estos modelos funcionan utilizando un conjunto predefinido de cajas, conocidas como cajas de anclaje, para identificar y localizar objetos dentro de una imagen. Las cajas de anclaje son esencialmente una rejilla de plantillas con varios tamaños y relaciones de aspecto que se colocan en mosaico a lo largo de la imagen. El modelo predice cómo desplazar y escalar estos anclajes para que coincidan con los recuadros delimitadores de los objetos, junto con una puntuación de confianza que indica la presencia de un objeto. Este enfoque simplifica el problema de la búsqueda de objetos convirtiéndolo en una tarea de regresión y clasificación relativa a estos anclajes fijos.

Algunos ejemplos destacados de arquitecturas basadas en anclas son la familia R-CNN, como Faster R-CNN, y los primeros detectores de una sola etapa como SSD (Single Shot MultiBox Detector) y muchos modelos YOLO, incluido el exitoso Ultralytics YOLOv5.

Cómo funcionan los detectores basados en anclas

La idea central de la detección basada en anclas es utilizar un conjunto de cajas de referencia predefinidas como punto de partida. Durante el proceso de formación del modelo, el detector aprende a realizar dos tareas principales para cada cuadro de anclaje:

  1. Clasificación: Determinar si una caja de anclaje contiene un objeto de interés o si es sólo fondo.
  2. Regresión: Calcula los desplazamientos precisos (x, y, anchura, altura) necesarios para ajustar el cuadro de anclaje de modo que encierre herméticamente el objeto detectado.

Estas predicciones las realiza el cabezal de detección del modelo tras procesar las características de la imagen extraídas por la columna vertebral. Dado que un mismo objeto puede ser detectado por varias cajas de anclaje, se utiliza un paso de posprocesamiento denominado supresión no máxima (NMS) para filtrar las detecciones redundantes y conservar sólo la caja que mejor se ajuste. El rendimiento de estos modelos suele evaluarse utilizando métricas como la Precisión Media Media (mAP) y la Intersección sobre Unión (IoU).

Detectores basados en anclajes frente a detectores sin anclajes

En los últimos años, los detectores sin anclas se han convertido en una alternativa muy popular. A diferencia de los modelos basados en anclas, los enfoques sin anclas predicen directamente la ubicación y el tamaño de los objetos, a menudo identificando puntos clave (como centros o esquinas de objetos) o prediciendo distancias desde un punto a los límites del objeto, lo que elimina la necesidad de formas de anclaje predefinidas.

Las principales diferencias son:

  • Complejidad: Los modelos basados en anclajes requieren un diseño y un ajuste cuidadosos de los parámetros de anclaje (tamaños, proporciones, escalas), que pueden depender del conjunto de datos. Los modelos sin anclas simplifican el diseño del cabezal de detección.
  • Flexibilidad: Los métodos sin anclajes pueden adaptarse mejor a objetos con relaciones de aspecto inusuales o formas no bien representadas por el conjunto de anclajes fijos.
  • Eficacia: La eliminación de los anclajes puede reducir el número de predicciones que debe realizar el modelo, lo que puede agilizar la inferencia y simplificar el postprocesamiento.

Aunque los detectores basados en anclas como YOLOv4 tuvieron mucho éxito, muchas arquitecturas modernas, incluida Ultralytics YOLO11, han adoptado diseños sin anclas para aprovechar sus ventajas en simplicidad y eficiencia. Puede explorar las ventajas de la detección sin anclajes en YOLO11 y ver comparaciones entre distintos modelos de YOLO.

Aplicaciones reales

Los detectores basados en anclas se utilizan ampliamente en diversas aplicaciones en las que los objetos tienen formas y tamaños relativamente estándar.

  • Conducción autónoma: En soluciones para la industria del automóvil, estos detectores son excelentes para identificar vehículos, peatones y señales de tráfico. Las formas predecibles de estos objetos se alinean bien con anclajes predefinidos, lo que permite una detección fiable para empresas como NVIDIA y Tesla.
  • Análisis del comercio minorista: Para la gestión de inventarios basada en IA, los modelos basados en anclas pueden escanear eficazmente las estanterías para contar los productos. El tamaño y la forma uniformes de los productos envasados los convierten en candidatos ideales para este enfoque, lo que ayuda a automatizar el control de las existencias.
  • Seguridad y vigilancia: La identificación de personas o vehículos en grabaciones de cámaras de vigilancia fijas es otro caso de uso importante. Esto es fundamental para aplicaciones como la guía de sistemas de alarma de seguridad Ultralytics.

Herramientas y formación

El desarrollo y despliegue de modelos de detección de objetos, basados o no en anclajes, implica el uso de marcos de trabajo como PyTorch o TensorFlow y bibliotecas como OpenCV. Plataformas como Ultralytics HUB ofrecen flujos de trabajo optimizados para el entrenamiento de modelos personalizados, la gestión de conjuntos de datos y el despliegue de soluciones, y admiten diversas arquitecturas de modelos. Para seguir aprendiendo, recursos como Papers With Code enumeran los modelos más avanzados, y cursos de plataformas como DeepLearning.AI cubren conceptos básicos.

Únase a la comunidad Ultralytics

Únase al futuro de la IA. Conecta, colabora y crece con innovadores de todo el mundo.

Únete ahora
Enlace copiado en el portapapeles