Ultralytics YOLO26 vs YOLO11 vs YOLOv8: ¿cuál deberías usar?
Explora Ultralytics YOLO26 vs Ultralytics YOLO11 vs Ultralytics YOLOv8 y descubre qué modelo de visión artificial deberías elegir para tus proyectos.
Los sistemas de visión artificial de vanguardia, a menudo basados en redes neuronales convolucionales (CNN), permiten a las máquinas analizar e interpretar datos visuales de imágenes y vídeos, y ya se están implementando en una amplia gama de entornos.
Desde la agricultura hasta la fabricación y el comercio minorista, estos sistemas operan en diversos entornos de despliegue, incluyendo dispositivos periféricos (edge), hardware integrado, dispositivos del Internet de las Cosas (IoT), procesamiento en el propio dispositivo y canales en la nube a gran escala que admiten aplicaciones en tiempo real.
En el uso real, implementar estos modelos no siempre es sencillo. A menudo necesitan funcionar con recursos informáticos limitados, cumplir requisitos estrictos de latencia y escalar sin aumentar significativamente los costes. Estas limitaciones hacen que el rendimiento sea un problema multidimensional, en lugar de depender únicamente de la precisión.
Aunque la precisión sigue siendo importante, es igual de relevante que un modelo funcione de forma eficiente en producción. Factores como la velocidad, el uso de recursos y la escalabilidad desempeñan un papel fundamental en el rendimiento a largo plazo de un sistema.
Los modelos de visión artificial como los modelos Ultralytics YOLO han evolucionado teniendo en cuenta este equilibrio. Por ejemplo, Ultralytics YOLOv8 estableció una base sólida y versátil, Ultralytics YOLO11 fue un paso más allá con mayor velocidad y precisión, y Ultralytics YOLO26 se basa en esto siendo más ligero, más rápido y más eficiente que nunca.

Fig 1. Uso de Ultralytics YOLO26 para detectar objetos en una imagen (Fuente)
En este artículo, compararemos Ultralytics YOLO26, YOLO11 y YOLOv8 para ayudarte a elegir el modelo adecuado para tu proyecto de visión artificial. ¡Empecemos!
Link to this sectionComprender cómo han evolucionado los modelos Ultralytics YOLO#
Cada iteración de los modelos Ultralytics YOLO ha introducido mejoras para satisfacer mejor las necesidades del mundo real y hacer que la visión artificial sea más accesible. Estas actualizaciones han hecho que los modelos sean más rápidos, más eficientes y más fáciles de implementar, apoyando el crecimiento del ecosistema de IA visual.
También están creados sobre PyTorch, lo que facilita su entrenamiento, personalización e integración en flujos de trabajo inteligentes de aprendizaje automático. De forma inmediata, los modelos Ultralytics YOLO están disponibles como modelos preentrenados, a menudo entrenados en conjuntos de datos como COCO, lo que permite a los equipos empezar rápidamente y ajustarlos para casos de uso específicos.
Además, el paquete de Python de Ultralytics simplifica la implementación al proporcionar soporte integrado para exportar modelos a formatos como ONNX y TensorRT. Esto facilita la integración de modelos en diferentes plataformas de hardware, desde dispositivos edge hasta sistemas acelerados por GPU.
Link to this sectionPasar de Ultralytics YOLOv5 a Ultralytics YOLO26#
El primer modelo Ultralytics YOLO, Ultralytics YOLOv5, se hizo muy popular por sus capacidades fiables de detección de objetos. Basado en un enfoque de detección de una sola etapa, permitía predicciones rápidas en tiempo real en una sola pasada, lo que lo hacía muy adecuado para flujos de trabajo de producción.
Actualizaciones posteriores introdujeron variantes sin anclas (anchor-free), donde el modelo predice las ubicaciones de los objetos directamente en lugar de usar cajas de anclaje predefinidas, haciendo la detección más flexible. Sin embargo, el modelo original siguió centrándose principalmente en tareas de detección de objetos.
Partiendo de esta base, YOLOv8 amplió el alcance de la familia de modelos. En lugar de centrarse solo en la detección de objetos, añadió soporte para múltiples tareas de visión artificial como la segmentación de instancias, la clasificación de imágenes, la estimación de poses y la detección de cajas delimitadoras orientadas (OBB). También aportó mejoras arquitectónicas, incluyendo diseños avanzados de backbone y neck, que mejoraron la extracción de características y el rendimiento general de la detección.
Más allá de esto, variantes como YOLOv8n (Nano), YOLOv8s (Small), YOLOv8m (Medium), YOLOv8l (Large) y YOLOv8x (Extra Large) dieron a los desarrolladores la flexibilidad de equilibrar la velocidad, la precisión y el uso de recursos según sus necesidades. Esta capacidad más amplia, combinada con su facilidad de uso, lo convirtió en la opción preferida para una amplia gama de aplicaciones visuales.

Fig 2. Los modelos YOLO como YOLOv8, YOLO11 y YOLO26 admiten una variedad de tareas de visión.
Posteriormente, YOLO11 se centró en mejorar el rendimiento en flujos de trabajo del mundo real, ofreciendo mayor precisión junto con velocidades de inferencia más rápidas. Con una arquitectura más ligera, funciona bien tanto en entornos edge como en la nube, siendo compatible con los flujos de trabajo existentes de YOLOv8.
La última incorporación a la familia de modelos Ultralytics YOLO, YOLO26, es un modelo de última generación que establece un nuevo estándar para la IA visual orientada al edge, ofreciendo un enfoque más ligero, rápido y eficiente para la implementación en el mundo real. Está diseñado para ejecutarse de forma eficiente en CPUs y sistemas integrados, al tiempo que simplifica la implementación y mejora el rendimiento en tiempo real en una amplia gama de aplicaciones.
Link to this sectionComparación entre YOLO26, YOLO11 y YOLOv8#
Al trabajar en proyectos de visión artificial, es posible que encuentres diferentes modelos de Ultralytics y te preguntes cuál es el adecuado para tu proyecto. Analicemos cómo se comparan YOLO26, YOLO11 y YOLOv8 en escenarios del mundo real.
YOLOv8 se lanzó en 2023 y ha sido ampliamente utilizado por la comunidad de visión artificial desde entonces. Su gran respaldo comunitario y facilidad de uso lo convirtieron en un modelo de referencia para muchos equipos en el pasado. Si buscas un modelo bien documentado con una amplia gama de tutoriales, guías y recursos de la comunidad, YOLOv8 es un excelente punto de partida.
En 2024, se introdujo YOLO11 con mejoras tanto en rendimiento como en eficiencia. Ofrece mayor velocidad y precisión en comparación con YOLOv8, manteniendo una arquitectura más pequeña y optimizada. Es un modelo más equilibrado que funciona de forma fiable en producción sin aumentar significativamente el uso de recursos.
Este año, se lanzó YOLO26 como la iteración más reciente, centrándose en una implementación eficiente a escala. Ofrece una inferencia de CPU más rápida y una mejor utilización de los recursos, permitiendo a los equipos ejecutar más cargas de trabajo en el mismo hardware.
Por ejemplo, el modelo YOLO26 nano puede lograr una inferencia hasta un 43% más rápida que YOLO11 en unidades centrales de procesamiento (CPU), lo que lo convierte en una excelente opción para entornos edge y con recursos limitados. Esto es especialmente vital porque las configuraciones tradicionales suelen depender en gran medida de unidades de procesamiento gráfico (GPU), que pueden ser costosas y difíciles de escalar.

Fig 3. Comparativa de rendimiento de YOLO26 en CPUs (Fuente)
En general, YOLO26 es una opción sólida para equipos e individuos que buscan optimizar el equilibrio entre rendimiento, coste y escalabilidad.
Link to this sectionUn vistazo más de cerca a Ultralytics YOLO26#
YOLO26 es un modelo de última generación diseñado para la implementación en el mundo real, donde la eficiencia, la velocidad y la escalabilidad importan tanto como la precisión. En lugar de centrarse solo en mejorar el rendimiento de los benchmarks, introduce cambios arquitectónicos y de entrenamiento que hacen que los modelos sean más fáciles de ejecutar, más rápidos de implementar y más fiables en diferentes entornos de hardware.
Estas mejoras son especialmente importantes para los sistemas edge y de producción, donde la capacidad de computación limitada, las restricciones de latencia y las consideraciones de costes juegan un papel clave. Al simplificar la inferencia y optimizar el rendimiento, YOLO26 permite a los entusiastas de la IA crear y escalar aplicaciones visuales de manera más eficiente.
Aquí tienes un vistazo a algunas de las características clave de YOLO26:
- Inferencia de extremo a extremo sin NMS: Uno de los cambios cruciales es su diseño sin supresión de no máximos (NMS), que elimina la necesidad de posprocesamiento. En términos sencillos, el modelo produce las predicciones finales directamente. Como resultado, la latencia se vuelve más predecible y la implementación resulta más sencilla.
- Eliminación de DFL: YOLO26 se aleja del módulo de pérdida focal de distribución (DFL) hacia un enfoque más sencillo de predicción de cajas delimitadoras. Este cambio se alinea con su diseño de extremo a extremo sin NMS, reduciendo la complejidad del flujo de trabajo y mejorando la consistencia en la implementación.
- Optimizador MuSGD: Los últimos modelos Ultralytics YOLO introducen MuSGD, un optimizador híbrido que combina el descenso de gradiente estocástico (SGD) con actualizaciones inspiradas en Muon. Esto mejora la estabilidad del entrenamiento y la convergencia, dando lugar a una optimización más fluida y un comportamiento más consistente en los diferentes tamaños de modelo.
- ProgLoss y STAL: Estas innovaciones en el entrenamiento, el equilibrio de pérdida progresivo (ProgLoss) y la asignación de etiquetas consciente de objetivos pequeños (STAL), hacen que el modelo sea más estable y fiable. ProgLoss ayuda al modelo a aprender de los conjuntos de datos por etapas a lo largo del tiempo, mientras que STAL asegura que los objetos pequeños no sean ignorados durante el entrenamiento, mejorando la detección en escenas complejas.
Link to this sectionPrecisión frente a eficiencia: Más allá de los benchmarks hacia el rendimiento en el mundo real#
Para poner las diferencias entre YOLO26, YOLO11 y YOLOv8 en contexto, comprendamos mejor los factores que impulsan el rendimiento del modelo en el uso real.
La precisión, medida a menudo por métricas de rendimiento como la precisión media promedio (mAP), ha sido una forma importante de evaluar los modelos de visión artificial durante mucho tiempo. Muestra cómo funciona un modelo en condiciones estandarizadas y es útil al comparar diferentes versiones.
Sin embargo, una vez que los modelos pasan de las pruebas a la implementación en el mundo real, la precisión por sí sola no es suficiente. El rendimiento en producción depende de factores como el tamaño del modelo, el tiempo de inferencia o latencia, el uso de computación y la capacidad de un sistema para escalar en diferentes entornos.
A diferencia de los benchmarks controlados, los entornos del mundo real suelen ser impredecibles. Las condiciones de iluminación pueden cambiar, los objetos pueden estar parcialmente visibles y los datos de entrada pueden variar significativamente respecto a aquellos con los que se entrenó el modelo. Estas variaciones pueden afectar a la consistencia del rendimiento de un modelo en la práctica.

Fig 4. Un ejemplo de YOLO26 utilizado en un entorno impredecible, como una obra de construcción.
Por ejemplo, considera una configuración con cientos de cámaras en una ciudad inteligente, tienda minorista o almacén. Cada flujo debe procesarse en tiempo real, requiriendo a menudo tasas de fotogramas consistentes (fotogramas por segundo, o FPS) para evitar retrasos o pérdida de fotogramas.
Un modelo menos eficiente puede gestionar menos flujos simultáneos en un sistema determinado, lo que significa que la escalabilidad suele requerir hardware adicional y aumenta los costes de infraestructura.
Los modelos más eficientes, como YOLO26, pueden procesar más flujos en el mismo hardware, aprovechando mejor los recursos disponibles. Esto mejora la eficiencia general del sistema y facilita el escalado de las implementaciones a lo largo del tiempo.
Para profundizar más en YOLO26, YOLO11 y YOLOv8, consulta la documentación oficial de Ultralytics.
Link to this sectionConclusiones clave#
La serie de modelos Ultralytics YOLO ha evolucionado para adaptarse mejor a las necesidades de implementación del mundo real. Cada versión se basa en la anterior, con un enfoque creciente en la eficiencia, la escalabilidad y la facilidad de implementación. En otras palabras, si estás creando una aplicación de detección en tiempo real que necesita ejecutarse de forma fiable a escala, Ultralytics YOLO26 es la elección perfecta.
¿Quieres incorporar IA visual en tus operaciones? Consulta nuestras opciones de licencia. También puedes visitar nuestras páginas de soluciones para ver cómo la IA en la fabricación está transformando las fábricas y cómo la IA visual en robótica está dando forma al futuro. Únete a nuestra creciente comunidad y explora nuestro repositorio de GitHub para obtener recursos de IA.






