Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
IA de visión

YOLO12 explicado: Aplicaciones y casos de uso en el mundo real

¡Descubre YOLO12, el modelo de visión artificial más reciente! Aprende cómo su arquitectura centrada en la atención y la tecnología FlashAttention mejoran las tareas de detección de objetos en todos los sectores.

ABAbirami Vina
5 min read
Detección de objetos con YOLO12 en aplicaciones del mundo real

La visión artificial es una rama de la inteligencia artificial (IA) que ayuda a las máquinas a comprender imágenes y vídeos. Es un campo que avanza a un ritmo increíble porque los investigadores y desarrolladores de IA superan constantemente los límites. La comunidad de IA siempre aspira a que los modelos sean más rápidos, inteligentes y eficientes. Uno de los últimos avances es YOLO12, la incorporación más reciente a la serie de modelos YOLO (You Only Look Once), lanzada el 18 de febrero de 2025.

YOLO12 fue desarrollado por investigadores de la Universidad de Buffalo, SUNY (Universidad Estatal de Nueva York) y la Universidad de la Academia China de las Ciencias. Con un enfoque nuevo y único, YOLO12 introduce mecanismos de atención, lo que permite que el modelo se centre en las partes más esenciales de una imagen en lugar de procesar todo por igual.

También incluye FlashAttention, una técnica que acelera el procesamiento mientras utiliza menos memoria, y un mecanismo de atención de área, diseñado para imitar la forma en que los humanos enfocan naturalmente los objetos centrales.

Estas mejoras hacen que YOLO12n sea un 2,1% más preciso que YOLOv10n y que YOLO12m sea un 1,0% más preciso que YOLO11m. Sin embargo, esto conlleva una contrapartida: YOLO12n es un 9% más lento que YOLOv10n, y YOLO12m es un 3% más lento que YOLO11m.

YOLO12 usándose para detectar objetos

Fig 1. Un ejemplo de YOLO12 siendo utilizado para detectar objetos.

En este artículo, exploraremos qué hace diferente a YOLO12, cómo se compara con versiones anteriores y dónde puede aplicarse.

Link to this sectionEl camino hacia el lanzamiento de YOLO12#

La serie de modelos YOLO es una colección de modelos de visión artificial diseñados para la detección de objetos en tiempo real, lo que significa que pueden identificar y localizar rápidamente objetos en imágenes y vídeos. Con el tiempo, cada versión ha mejorado en términos de velocidad, precisión y eficiencia.

Por ejemplo, Ultralytics YOLOv5, lanzado en 2020, se utilizó ampliamente porque era rápido y fácil de entrenar e implementar de forma personalizada. Más tarde, Ultralytics YOLOv8 mejoró esto ofreciendo soporte adicional para tareas de visión artificial como la segmentación de instancias y el seguimiento de objetos.

Más recientemente, Ultralytics YOLO11 se centró en mejorar el procesamiento en tiempo real manteniendo un equilibrio entre velocidad y precisión. Por ejemplo, YOLO11m tenía un 22% menos de parámetros que YOLOv8m, pero aun así ofrecía un mejor rendimiento de detección en el conjunto de datos COCO, un punto de referencia muy utilizado para evaluar modelos de detección de objetos.

Partiendo de estos avances, YOLO12 introduce un cambio en la forma en que procesa la información visual. En lugar de tratar todas las partes de una imagen por igual, prioriza las áreas más relevantes, mejorando la precisión de la detección. En pocas palabras, YOLO12 se basa en mejoras anteriores mientras busca ser más preciso.

Link to this sectionCaracterísticas clave de YOLO12#

YOLO12 introduce varias mejoras que potencian las tareas de visión artificial mientras mantienen intactas las velocidades de procesamiento en tiempo real. Aquí tienes un resumen de las características clave de YOLO12:

  • Arquitectura centrada en la atención: En lugar de tratar cada parte de una imagen por igual, YOLO12 se centra en las áreas más importantes. Esto mejora la precisión y reduce el procesamiento innecesario, haciendo que la detección sea más nítida y eficiente, incluso en imágenes con mucho ruido.
  • FlashAttention: YOLO12 acelera el análisis de imágenes mientras utiliza menos memoria. Con FlashAttention (un algoritmo eficiente en memoria), optimiza el manejo de datos, reduciendo la carga del hardware y haciendo que las tareas en tiempo real sean más fluidas y fiables.
  • Redes de Agregación de Capas Eficientes Residuales (R-ELAN): YOLO12 organiza sus capas de manera más eficiente utilizando R-ELAN, lo que mejora cómo el modelo procesa y aprende de los datos. Esto hace que el entrenamiento sea más estable, el reconocimiento de objetos más nítido y los requisitos informáticos menores, por lo que funciona eficientemente en diferentes entornos.

Para entender cómo funcionan estas características en la vida real, piensa en un centro comercial. YOLO12 puede ayudar a rastrear a los compradores, identificar decoraciones de tiendas como plantas en macetas o carteles promocionales, y detectar artículos extraviados o abandonados.

Su arquitectura centrada en la atención le ayuda a enfocarse en los detalles más importantes, mientras que FlashAttention garantiza que procese todo rápidamente sin sobrecargar el sistema. Esto facilita que los operadores de los centros comerciales mejoren la seguridad, organicen los diseños de las tiendas y mejoren la experiencia de compra general.

Detección de objetos en un centro comercial usando YOLO12

Fig 2. Detectando objetos en un centro comercial usando YOLO12.

Sin embargo, YOLO12 también viene con algunas limitaciones a considerar:

  • Tiempos de entrenamiento más lentos: Debido a su arquitectura, YOLO12 requiere más tiempo de entrenamiento en comparación con YOLO11.
  • Desafíos de exportación: Algunos usuarios pueden encontrar dificultades al exportar modelos de YOLO12, especialmente al integrarlos en entornos de implementación específicos.

Link to this sectionComprendiendo los puntos de referencia de rendimiento de YOLO12#

YOLO12 viene en múltiples variantes, cada una optimizada para diferentes necesidades. Las versiones más pequeñas (nano y small) priorizan la velocidad y la eficiencia, lo que las hace ideales para dispositivos móviles y computación en el borde (edge computing). Las versiones medium y large logran un equilibrio entre velocidad y precisión, mientras que YOLO12x (extra large) está diseñada para aplicaciones de alta precisión, como la automatización industrial, la imagen médica y los sistemas de vigilancia avanzados.

Con estas variaciones, YOLO12 ofrece diferentes niveles de rendimiento según el tamaño del modelo. Las pruebas de referencia muestran que ciertas variantes de YOLO12 superan a YOLOv10 y YOLO11 en precisión, logrando una precisión media promedio (mAP) más alta.

Sin embargo, algunos modelos, como YOLO12m, YOLO12l y YOLO12x, procesan las imágenes más lentamente que YOLO11, lo que muestra una contrapartida entre la precisión de detección y la velocidad. A pesar de esto, YOLO12 sigue siendo eficiente, requiriendo menos parámetros que muchos otros modelos, aunque todavía usa más que YOLO11. Esto lo convierte en una excelente opción para aplicaciones donde la precisión es más importante que la velocidad bruta.

Comparación entre Ultralytics YOLO11 y YOLO12

Fig 3. Comparando Ultralytics YOLO11 y YOLO12.

Link to this sectionUsando YOLO12 a través del paquete Python de Ultralytics#

YOLO12 es compatible con el paquete Python de Ultralytics y es fácil de usar, haciéndolo accesible tanto para principiantes como para profesionales. Con solo unas pocas líneas de código, los usuarios pueden cargar modelos preentrenados, realizar diversas tareas de visión artificial en imágenes y vídeos, y también entrenar YOLO12 en conjuntos de datos personalizados. El paquete Python de Ultralytics agiliza el proceso, eliminando la necesidad de pasos de configuración complejos.

Por ejemplo, aquí están los pasos que seguirías para usar YOLO12 para la detección de objetos:

  • Instala el paquete Ultralytics: Primero, instala el paquete Python de Ultralytics, que proporciona las herramientas necesarias para ejecutar YOLO12 eficientemente. Esto garantiza que todas las dependencias estén configuradas correctamente.
  • Carga un modelo YOLO12 preentrenado: Elige la variante de YOLO12 adecuada (nano, small, medium, large o extra large) según el nivel de precisión y velocidad requerido para tu tarea.
  • Proporciona una imagen o vídeo: Introduce un archivo de imagen o vídeo que quieras analizar. YOLO12 también puede procesar transmisiones de vídeo en directo para la detección en tiempo real.
  • Ejecuta el proceso de detección: El modelo escanea los datos visuales, identifica los objetos y coloca cuadros delimitadores (bounding boxes) a su alrededor. Etiqueta cada objeto detectado con su clase predicha y puntuación de confianza.
  • Ajusta la configuración de detección: También puedes modificar parámetros como los umbrales de confianza para ajustar con precisión la detección y el rendimiento.
  • Guarda o usa el resultado: La imagen o vídeo procesado, que ahora contiene los objetos detectados, puede guardarse o integrarse en una aplicación para un análisis posterior, automatización o toma de decisiones.

Estos pasos hacen que YOLO12 sea fácil de usar para una variedad de aplicaciones, desde vigilancia y seguimiento minorista hasta imagen médica y vehículos autónomos.

Link to this sectionAplicaciones prácticas de YOLO12#

YOLO12 puede usarse en una variedad de aplicaciones del mundo real gracias a su compatibilidad con la detección de objetos, segmentación de instancias, clasificación de imágenes, estimación de poses y detección de objetos orientados (OBB).

YOLO12 dando soporte a tareas como la detección de objetos y la segmentación de instancias

Fig 4. YOLO12 soporta tareas como detección de objetos y segmentación de instancias.

Sin embargo, como discutimos anteriormente, los modelos YOLO12 priorizan la precisión sobre la velocidad, lo que significa que tardan un poco más en procesar imágenes en comparación con versiones anteriores. Esta contrapartida hace que YOLO12 sea ideal para aplicaciones donde la precisión es más importante que la velocidad en tiempo real, tales como:

  • Imagen médica: YOLO12 puede entrenarse de forma personalizada para detectar tumores o anomalías en radiografías y resonancias magnéticas con alta precisión, lo que lo convierte en una herramienta útil para médicos y radiólogos que necesitan un análisis de imagen preciso para el diagnóstico.
  • Control de calidad en fabricación: Puede ayudar a identificar defectos en productos durante el proceso de producción, asegurando que solo los artículos de alta calidad lleguen al mercado mientras se reduce el desperdicio y se mejora la eficiencia.
  • Análisis forense: Las fuerzas del orden pueden ajustar YOLO12 para analizar imágenes de vigilancia y recopilar pruebas. En investigaciones criminales, la precisión es vital para identificar detalles clave.
  • Agricultura de precisión: Los agricultores pueden usar YOLO12 para analizar la salud de los cultivos, detectar enfermedades o infestaciones de plagas y controlar las condiciones del suelo. Las evaluaciones precisas ayudan a optimizar las estrategias agrícolas, lo que conduce a un mejor rendimiento y gestión de recursos.

Link to this sectionEmpezando con YOLO12#

Antes de ejecutar YOLO12, es importante asegurarse de que tu sistema cumpla con los requisitos necesarios.

Técnicamente, YOLO12 puede ejecutarse en cualquier GPU (Graphics Processing Unit) dedicada. Por defecto, no requiere FlashAttention, por lo que puede funcionar en la mayoría de los sistemas con GPU sin él. Sin embargo, habilitar FlashAttention puede ser especialmente útil al trabajar con grandes conjuntos de datos o imágenes de alta resolución, ya que ayuda a evitar ralentizaciones, reducir el uso de memoria y mejorar la eficiencia del procesamiento.

Para usar FlashAttention, necesitarás una GPU NVIDIA de una de estas series: Turing (T4, Quadro RTX), Ampere (serie RTX 30, A30, A40, A100), Ada Lovelace (serie RTX 40) o Hopper (H100, H200).

Teniendo en cuenta la usabilidad y la accesibilidad, el paquete Python de Ultralytics aún no es compatible con la inferencia de FlashAttention, ya que su instalación puede ser técnicamente compleja. Para obtener más información sobre cómo empezar con YOLO12 y optimizar su rendimiento, consulta la documentación oficial de Ultralytics.

Link to this sectionConclusiones clave#

A medida que avanza la visión artificial, los modelos se vuelven más precisos y eficientes. YOLO12 mejora las tareas de visión artificial como la detección de objetos, la segmentación de instancias y la clasificación de imágenes con procesamiento centrado en la atención y FlashAttention, mejorando la precisión mientras se optimiza el uso de la memoria.

Al mismo tiempo, la visión artificial es más accesible que nunca. YOLO12 es fácil de usar a través del paquete Python de Ultralytics y, con su enfoque en la precisión sobre la velocidad, es muy adecuado para la imagen médica, las inspecciones industriales y la robótica: aplicaciones donde la precisión es clave.

¿Sientes curiosidad por la IA? Visita nuestro repositorio de GitHub e interactúa con nuestra comunidad. Explora las innovaciones en sectores como la IA en coches autónomos y la visión artificial en la agricultura en nuestras páginas de soluciones. Echa un vistazo a nuestras opciones de licencia y haz realidad tus proyectos de IA visual. 🚀

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático