¡Sintonice YOLO Vision 2025!
25 de septiembre de 2025
10:00 — 18:00 BST
Evento híbrido
Visión Yolo 2024

Las ventajas de que Ultralytics YOLO11 sea un detector sin anclaje (anchor-free)

Abirami Vina

5 minutos de lectura

5 de diciembre de 2024

Comprenda cómo Ultralytics YOLO11 admite la detección de objetos sin anclas y los beneficios que esta arquitectura de modelo aporta a diversas aplicaciones.

Si echamos la vista atrás a la historia de los modelos de Visión Artificial, el concepto de detección de objetos - una tarea central de la visión artificial que implica la identificación y localización de objetos dentro de una imagen o vídeo - existe desde la década de 1960. Sin embargo, la razón clave de su importancia en las innovaciones de vanguardia actuales es que las técnicas de detección de objetos y las arquitecturas de modelos han avanzado y mejorado rápidamente desde entonces. 

En un artículo anterior, hablamos de la evolución de la detección de objetos y del camino que ha llevado a los modelos Ultralytics YOLO. Hoy, nos centraremos en explorar un hito más específico en este viaje: el salto de los detectores basados en anclajes a los detectores sin anclajes. 

Los detectores basados en anclajes se basan en cajas predefinidas, llamadas "anclajes", para predecir dónde están los objetos en una imagen. En cambio, los detectores sin anclajes omiten estas cajas predefinidas y, en su lugar, predicen las ubicaciones de los objetos directamente.

Si bien este cambio puede parecer un cambio simple y lógico, en realidad ha conducido a mejoras importantes en la precisión y la eficiencia de la detección de objetos. En este artículo, comprenderemos cómo los detectores sin anclaje han remodelado la visión artificial a través de avances como Ultralytics YOLO11.

¿Qué son los detectores basados en anclajes?

Los detectores basados en anclajes utilizan cajas predefinidas, conocidas como anclajes, para ayudar a localizar objetos en una imagen. Piense en estos anclajes como una cuadrícula de cajas de diferentes tamaños y formas colocadas sobre la imagen. A continuación, el modelo ajusta estas cajas para que se ajusten a los objetos que detecta. Por ejemplo, si el modelo identifica un coche, modificará el anchor box para que coincida con la posición y el tamaño del coche con mayor precisión.

Cada ancla está asociada a un posible objeto en la imagen, y durante el entrenamiento, el modelo aprende a ajustar los cuadros de anclaje para que coincidan mejor con la ubicación, el tamaño y la relación de aspecto del objeto. Esto permite al modelo detectar objetos a diferentes escalas y orientaciones. Sin embargo, seleccionar el conjunto correcto de cuadros de anclaje puede llevar mucho tiempo, y el proceso de ajuste fino puede ser propenso a errores.

__wf_reserved_inherit
Fig. 1. ¿Qué es un Anchor Box?

Si bien los detectores basados en anclajes, como YOLOv4, han funcionado bien en muchas aplicaciones, tienen algunos inconvenientes. Por ejemplo, los cuadros de anclaje no siempre se alinean bien con objetos de diferentes formas o tamaños, lo que dificulta que el modelo detecte objetos pequeños o con formas irregulares. El proceso de selección y ajuste de los tamaños de los cuadros de anclaje también puede llevar mucho tiempo y requiere mucho esfuerzo manual. Aparte de esto, los modelos basados en anclajes a menudo tienen dificultades para detectar objetos ocluidos o superpuestos, ya que los cuadros predefinidos pueden no adaptarse bien a estos escenarios más complejos.

El cambio a la detección de objetos sin anclajes

Los detectores sin anclaje comenzaron a ganar atención en 2018 con modelos como CornerNet y CenterNet, que adoptaron un enfoque novedoso para la detección de objetos al eliminar la necesidad de cuadros delimitadores (anchor boxes) predefinidos. A diferencia de los modelos tradicionales que se basan en cuadros delimitadores de diferentes tamaños y formas para predecir dónde están los objetos, los modelos sin anclaje predicen las ubicaciones de los objetos directamente. Se centran en puntos clave o características del objeto, como el centro, lo que simplifica el proceso de detección y lo hace más rápido y preciso.

Así es como funcionan generalmente los modelos sin anclaje:

  • Detección de puntos clave: En lugar de utilizar cuadros predefinidos, algunos modelos identifican puntos importantes en un objeto, como el centro o esquinas específicas. Estos puntos clave ayudan a los modelos a determinar dónde está el objeto y su tamaño.
  • Centro predicción: Algunos modelos se centran en predecir el centro de un objeto. Una vez que se localiza el centro, el modelo puede predecir el tamaño y la posición de todo el objeto a partir de ahí.
  • Regresión de mapas de calor: Muchos modelos sin anclaje utilizan mapas de calor, donde cada píxel representa una posible ubicación de un objeto. Los valores más fuertes del mapa de calor indican una mayor confianza en que un objeto está presente en ese punto.
__wf_reserved_inherit
Fig. 2. Detección basada en anclajes frente a detección sin anclajes.

Debido a que los modelos sin anclaje no dependen de los anchor boxes, tienen un diseño más simple. Esto significa que son más eficientes desde el punto de vista computacional. Dado que no tienen que procesar múltiples anchor boxes, pueden detectar objetos más rápidamente, una ventaja importante en aplicaciones en tiempo real como la conducción autónoma y la videovigilancia. 

Los modelos sin anclaje también son mucho mejores para manejar objetos pequeños, irregulares u ocluidos. Dado que se centran en la detección de puntos clave en lugar de tratar de ajustar cuadros delimitadores, son mucho más flexibles. Esto les permite detectar objetos con precisión en entornos complejos o desordenados donde los modelos basados en anclajes pueden fallar.

Ultralytics YOLO11: Un detector sin anclajes

Originalmente diseñados para la velocidad y la eficiencia, los modelos YOLO han pasado gradualmente de los métodos basados en anclajes a la detección sin anclajes, lo que hace que modelos como YOLO11 sean más rápidos, más flexibles y más adecuados para una amplia gama de aplicaciones en tiempo real.

Aquí hay una mirada rápida a cómo ha evolucionado el diseño sin anclajes en las diferentes versiones de YOLO:

  • Ultralytics YOLOv5u: Introdujo el Head de Ultralytics dividido y sin anclajes (Anchor-Free Split Ultralytics Head), eliminando la necesidad de anchor boxes predefinidos. En cambio, el modelo predice directamente dónde están los objetos en una imagen, simplificando el proceso y mejorando la flexibilidad y la velocidad.
  • YOLOv6: Se utilizó un nuevo método llamado Entrenamiento Asistido por Anclajes (AAT), donde los anclajes se utilizaron solo durante el entrenamiento. Esto permitió que el modelo se beneficiara de la estructura de los métodos basados en anclajes durante el entrenamiento, al tiempo que seguía utilizando la detección sin anclajes en tiempo de ejecución para una mejor velocidad y adaptabilidad.
  • Ultralytics YOLOv8: Cambió por completo a la detección sin anclajes utilizando el Head de Ultralytics dividido y sin anclajes (Anchor-Free Split Ultralytics Head). Esto hizo que el modelo fuera más rápido y preciso, especialmente para objetos pequeños o con formas irregulares que no encajan bien con los anchor boxes.
  • Ultralytics YOLO11: Se basa en el enfoque sin anclajes de YOLOv8, optimizando aún más la detección al eliminar por completo los anchor boxes. Esto resulta en una detección más rápida y precisa para aplicaciones en tiempo real como la monitorización del comportamiento animal y la analítica minorista.
__wf_reserved_inherit
Fig. 3. Comparación entre Ultralytics YOLOv8 y Ultralytics YOLO11.

Aplicaciones en el mundo real de YOLO11

Un gran ejemplo de los beneficios de la detección sin anclaje utilizando YOLO11 se encuentra en los vehículos autónomos. En los coches autónomos, detectar peatones, otros vehículos y obstáculos de forma rápida y precisa es crucial para la seguridad. El enfoque sin anclaje de YOLO11 simplifica el proceso de detección al predecir directamente los puntos clave de los objetos, como el centro de un peatón o los límites de otro vehículo, en lugar de depender de cajas de anclaje predefinidas. 

__wf_reserved_inherit
Fig 4. Beneficios de la detección sin anclajes en YOLO11 (Imagen del autor).

YOLO11 no necesita ajustar o encajar una cuadrícula de anchors a cada objeto, lo que puede ser computacionalmente costoso y lento. En cambio, se centra en características clave, haciéndolo más rápido y eficiente. Por ejemplo, cuando un peatón se cruza en el camino del vehículo, YOLO11 puede identificar rápidamente su ubicación al señalar puntos clave, incluso si la persona está parcialmente oculta o en movimiento. La capacidad de adaptarse a diversas formas y tamaños sin anchor boxes permite a YOLO11 detectar objetos de manera más fiable y a mayor velocidad, lo cual es vital para la toma de decisiones en tiempo real en sistemas de conducción autónoma.

Otras aplicaciones donde las capacidades sin anclaje de YOLO11 realmente destacan incluyen:

  • Gestión minorista y de inventario: YOLO11 facilita la supervisión de los productos en los estantes, incluso cuando están apilados o parcialmente bloqueados. Esto ayuda a un seguimiento del inventario más rápido y preciso, y reduce los errores.
  • Imágenes médicas: YOLO11 también es eficaz en el sector de la salud, donde puede detectar tumores u otras anomalías en escaneos médicos. Su capacidad para trabajar con objetos de formas irregulares ayuda a mejorar la precisión en el diagnóstico de afecciones complejas.
  • Monitorización de la vida silvestre: En la investigación de la vida silvestre, YOLO11 puede rastrear animales en bosques densos o terrenos difíciles, lo que ayuda a los investigadores a controlar el comportamiento o proteger las especies en peligro de extinción.
  • Análisis deportivo: YOLO11 se puede utilizar para rastrear jugadores, movimientos de balón u otros elementos en tiempo real durante eventos deportivos para proporcionar información valiosa para equipos, entrenadores y emisoras.

Consideraciones a tener en cuenta al trabajar con modelos sin anclaje

Si bien los modelos sin anclajes como YOLO11 ofrecen muchas ventajas, también tienen ciertas limitaciones. Una de las principales consideraciones prácticas que hay que tener en cuenta es que incluso los modelos sin anclajes pueden tener dificultades con las oclusiones o los objetos muy superpuestos. La razón de esto es que la visión artificial pretende replicar la visión humana, y al igual que a veces nos cuesta identificar objetos ocluidos, los modelos de IA pueden enfrentarse a desafíos similares.

Otro factor interesante está relacionado con el procesamiento de las predicciones del modelo. Aunque la arquitectura de los modelos sin anclaje es más simple que la basada en anclajes, se hace necesario un refinamiento adicional en ciertos casos. Por ejemplo, pueden ser necesarias técnicas de post-procesamiento como la supresión no máxima (NMS) para limpiar las predicciones superpuestas o mejorar la precisión en escenas concurridas.

Asegurando el futuro de la IA con YOLO11

El cambio de la detección basada en anclajes a la detección sin anclajes ha sido un avance significativo en la detección de objetos. Con modelos sin anclajes como YOLO11, el proceso se simplifica, lo que conduce a mejoras tanto en la precisión como en la velocidad.

A través de YOLO11, hemos visto cómo la detección de objetos sin anclaje sobresale en aplicaciones en tiempo real como coches autónomos, videovigilancia e imágenes médicas, donde la detección rápida y precisa es crucial. Este enfoque permite a YOLO11 adaptarse más fácilmente a los diferentes tamaños de objetos y escenas complejas, proporcionando un mejor rendimiento en diversos entornos.

A medida que la visión artificial siga evolucionando, la detección de objetos será cada vez más rápida, flexible y eficiente.

Explore nuestro repositorio de GitHub y únase a nuestra activa comunidad para mantenerse al día sobre todo lo relacionado con la IA. Compruebe cómo la IA visual está impactando en sectores como la fabricación y la agricultura.

¡Construyamos juntos el futuro
de la IA!

Comience su viaje con el futuro del aprendizaje automático

Empezar gratis
Enlace copiado en el portapapeles