Ultralytics YOLO26: El nuevo estándar para la IA de visión centrada en el Edge
Aprende cómo Ultralytics YOLO26 establece un nuevo estándar para la IA de visión centrada en el Edge con inferencia de extremo a extremo sin NMS, un rendimiento de CPU más rápido y un despliegue en producción simplificado.

Hoy, Ultralytics lanza oficialmente YOLO26, el modelo YOLO más avanzado y desplegable hasta la fecha. Anunciado por primera vez en YOLO Vision 2025 (YV25), YOLO26 representa un cambio fundamental en cómo se entrenan, despliegan y escalan los modelos de visión artificial en sistemas del mundo real.
La IA de visión se está moviendo rápidamente hacia el borde (edge). Cada vez más, las imágenes y los vídeos se procesan directamente en dispositivos, cámaras, robots y sistemas embebidos, donde la latencia, la fiabilidad y el coste importan más que la computación bruta en la nube. YOLO26 está diseñado para esta realidad, ofreciendo un rendimiento líder mundial mientras se ejecuta de manera eficiente en CPUs, aceleradores de borde y hardware de bajo consumo.
Aunque YOLO26 es un salto significativo, mantiene la experiencia familiar y simplificada de Ultralytics YOLO en la que confían los desarrolladores. Encaja perfectamente en los flujos de trabajo existentes, admite una amplia gama de tareas de visión y sigue siendo fácil de usar, lo que hace que su adopción sea sencilla tanto para equipos de investigación como de producción.

Fig 1. Un ejemplo del uso de Ultralytics YOLO26 para la detección de objetos
En este artículo, desglosaremos todo lo que necesitas saber sobre Ultralytics YOLO26 y lo que significa un modelo YOLO más ligero, pequeño y rápido para el futuro de la IA de visión. ¡Empecemos!
Link to this sectionUltralytics YOLO26 establece un nuevo estándar para la IA de visión#
Ultralytics YOLO26 se basa en la idea de que las capacidades impactantes de la IA de visión deberían ser fáciles de acceder para todos. Creemos que las herramientas potentes de computer vision no deberían estar bloqueadas ni limitadas a un pequeño grupo de organizaciones.
En YV25 en Londres, nuestro fundador y CEO Glenn Jocher compartió sus pensamientos sobre esta visión, diciendo: “La tecnología de IA más sorprendente está a puerta cerrada. No es abierta. Las grandes empresas controlan los nuevos desarrollos y todos los demás tienen que esperar en la fila para acceder. Tenemos una visión diferente en Ultralytics. Queremos que la IA esté en manos de todos”.
También explicó que esto significa sacar la IA de la nube y llevarla a entornos del mundo real, añadiendo: “Queremos que la tecnología no solo pase el rato en la nube, sino que se lleve a dispositivos de borde, a tu teléfono, a tus vehículos y a sistemas de bajo consumo. Y queremos que estas personas increíbles que están creando soluciones tengan acceso a eso”.
YOLO26 refleja esta visión en la práctica: un modelo diseñado para ejecutarse donde la IA de visión se despliega realmente, no donde es más fácil crear prototipos.
Link to this sectionDesglosando Ultralytics YOLO26: Un modelo de visión de última generación#
Al igual que los modelos anteriores de Ultralytics YOLO, YOLO26 admite múltiples tareas de visión artificial dentro de una familia de modelos única y unificada. Está disponible en cinco tamaños: Nano (n), Small (s), Medium (m), Large (l) y Extra Large (x), lo que permite a los equipos equilibrar la velocidad, la precisión y el tamaño del modelo según las restricciones de despliegue.
Más allá de la flexibilidad, YOLO26 eleva el nivel de rendimiento. En comparación con YOLO11, el modelo nano de YOLO26 ofrece hasta un 43% más de velocidad de inferencia en CPU, convirtiéndolo en uno de los modelos de detección de objetos de alta precisión más rápidos disponibles para despliegue en el borde y basado en CPU.

Fig 2. Ultralytics YOLO26 es un modelo de visión de última generación.
Aquí tienes un vistazo más detallado a las computer vision tasks compatibles con YOLO26:
- Clasificación de imágenes: YOLO26 puede analizar una imagen completa y asignarla a una categoría específica, ayudando a los sistemas a comprender el contexto general de una escena.
- Detección de objetos: El modelo puede encontrar y localizar múltiples objetos en imágenes o vídeos.
- Segmentación de instancias: YOLO26 puede delinear objetos individuales con detalle a nivel de píxel.
- Estimación de poses: Se puede utilizar para identificar puntos clave y estimar poses para personas y otros objetos.
- Detección de cajas delimitadoras orientadas (OBB): YOLO26 puede detectar objetos en diferentes ángulos, lo cual es especialmente útil para imágenes aéreas y de satélite.
- Seguimiento de objetos: En combinación con el paquete de Python de Ultralytics, YOLO26 puede utilizarse para seguir objetos a través de fotogramas de vídeo y transmisiones en vivo.
Todas las tareas admiten entrenamiento, validación, inferencia y exportación dentro de un marco coherente.
Link to this sectionInnovaciones clave detrás de Ultralytics YOLO26#
Ultralytics YOLO26 introduce varias innovaciones centrales que mejoran la velocidad de inferencia, la estabilidad del entrenamiento y la simplicidad del despliegue. Aquí tienes un resumen de estas innovaciones:
- Eliminación de Distribution Focal Loss (DFL): El módulo DFL se ha eliminado para simplificar la predicción de cajas delimitadoras, mejorar la compatibilidad con el hardware y hacer que los modelos sean más fáciles de exportar y ejecutar en dispositivos de borde y de bajo consumo.
- Inferencia sin NMS de extremo a extremo: YOLO26 está diseñado como un modelo nativo de extremo a extremo que genera predicciones finales directamente, eliminando la necesidad de Non-Maximum Suppression y reduciendo la latencia de inferencia y la complejidad del despliegue.
- Balanceo progresivo de pérdida + STAL: Estas estrategias de pérdida mejoradas estabilizan el entrenamiento y mejoran la precisión de detección, particularmente para objetos pequeños y difíciles de detectar.
- Optimizador MuSGD: YOLO26 utiliza un nuevo optimizador híbrido que combina SGD con técnicas de optimización inspiradas en Muon para un entrenamiento más estable.
- Hasta un 43% más rápido en inferencia de CPU: Optimizado específicamente para la computación de borde, YOLO26 ofrece hasta un 43% más de velocidad de inferencia de CPU, permitiendo un rendimiento en tiempo real en dispositivos de borde.
A continuación, profundicemos en estas características de próxima generación que hacen que YOLO26 sea más rápido, más eficiente y más fácil de implementar.
Link to this sectionSimplificando la predicción mediante la eliminación de Distribution Focal Loss#
Los modelos YOLO anteriores utilizaban Distribution Focal Loss (DFL) durante el entrenamiento para mejorar la precisión de la caja delimitadora. Aunque era eficaz, DFL introducía una complejidad adicional e imponía límites de regresión fijos que hacían que la exportación y el despliegue fueran más difíciles, especialmente en hardware de borde y de bajo consumo.
YOLO26 elimina DFL por completo. Eliminar DFL elimina los límites de regresión de cajas delimitadoras fijos presentes en modelos anteriores, mejorando la fiabilidad y precisión al detectar objetos muy grandes.
Al simplificar el proceso de predicción de cajas delimitadoras, YOLO26 se vuelve más fácil de exportar y se ejecuta de forma más fiable en una amplia gama de dispositivos de borde y de bajo consumo.
Link to this sectionInferencia de extremo a extremo sin NMS con Ultralytics YOLO26#
Los flujos de trabajo tradicionales de object detection dependen de Non-Maximum Suppression (NMS) como un paso de posprocesamiento para filtrar predicciones superpuestas. Aunque es eficaz, NMS añade latencia, complejidad y fragilidad, especialmente al desplegar modelos en múltiples entornos de ejecución y objetivos de hardware.
YOLO26 introduce un modo de inferencia nativo de extremo a extremo, donde el modelo genera directamente las predicciones finales sin requerir NMS como un paso separado de posprocesamiento. Las predicciones duplicadas se gestionan dentro de la propia red.
Eliminar NMS reduce la latencia, simplifica los flujos de trabajo de despliegue y disminuye el riesgo de errores de integración, haciendo que YOLO26 sea especialmente adecuado para despliegues en tiempo real y en el borde.
Link to this sectionMejorando el reconocimiento con Progressive Loss Balancing + STAL#
Una característica crucial relacionada con el entrenamiento es la introducción de Progressive Loss Balancing (ProgLoss) y Small-Target-Aware Label Assignment (STAL). Estas funciones de pérdida mejoradas ayudan a estabilizar el entrenamiento y mejorar la precisión de detección.
ProgLoss ayuda al modelo a aprender de forma más consistente durante el entrenamiento, reduciendo la inestabilidad y permitiéndole converger de forma más fluida. Mientras tanto, STAL se centra en mejorar cómo el modelo aprende de objetos pequeños, que a menudo son más difíciles de detectar debido al detalle visual limitado.
Juntos, ProgLoss y STAL conducen a detecciones más fiables, con mejoras notables en el reconocimiento de objetos pequeños. Esto es especialmente importante para aplicaciones de borde como el Internet de las cosas (IoT), robótica e imágenes aéreas, donde los objetos suelen ser pequeños, distantes o parcialmente visibles.
Link to this sectionEntrenamiento más estable con el optimizador MuSGD#
Con YOLO26, adoptamos un nuevo optimizador llamado MuSGD, diseñado para hacer que el entrenamiento sea más estable y eficiente. MuSGD es un enfoque híbrido que combina las fortalezas del tradicional Stochastic Gradient Descent (SGD) con técnicas inspiradas en Muon, un optimizador utilizado en el entrenamiento de grandes modelos de lenguaje (LLM).
SGD ha sido una opción fiable en visión artificial durante mucho tiempo, gracias a su simplicidad y fuerte generalización. Al mismo tiempo, los avances recientes en el entrenamiento de LLM han demostrado que los métodos de optimización más nuevos pueden mejorar la estabilidad y la velocidad cuando se aplican con cuidado. MuSGD trae algunas de estas ideas al espacio de la visión artificial.
Inspirado en Kimi K2 de Moonshot AI, MuSGD incorpora estrategias de optimización que ayudan al modelo a converger de forma más fluida durante el entrenamiento. Esto hace posible que YOLO26 alcance un alto rendimiento más rápido mientras reduce la inestabilidad del entrenamiento, especialmente en configuraciones de entrenamiento más grandes o complejas.
MuSGD ayuda a YOLO26 a entrenar de forma más predecible en todos los tamaños de modelo, contribuyendo tanto a las ganancias de rendimiento como a la estabilidad del entrenamiento.
Link to this sectionUltralytics YOLO26 ofrece hasta un 43% más de velocidad de inferencia en CPU#
A medida que la IA de visión sigue acercándose al lugar donde se generan los datos, un rendimiento sólido en el borde es cada vez más crucial. Optimizado específicamente para la computación de borde, YOLO26 ofrece hasta un 43% más de velocidad de inferencia en CPU, asegurando un rendimiento en tiempo real en dispositivos sin GPUs. Esta mejora permite que sistemas de visión receptivos y fiables se ejecuten directamente en cámaras, robots y hardware embebido, donde las restricciones de latencia, eficiencia y coste definen lo que es posible.
Link to this sectionTareas de visión artificial mejoradas compatibles con Ultralytics YOLO26#
Más allá de las mejoras arquitectónicas que hacen que la detección de objetos sea más precisa, YOLO26 también incluye optimizaciones específicas para tareas diseñadas para mejorar el rendimiento en diversas tareas de visión artificial. Por ejemplo, mejora la segmentación de instancias, la estimación de poses y la detección de cajas delimitadoras orientadas con actualizaciones específicas que mejoran la precisión y la fiabilidad.
Aquí tienes un resumen de estas optimizaciones:
- Segmentación de instancias: YOLO26 utiliza la pérdida de segmentación semántica para mejorar cómo aprende el modelo durante el entrenamiento, lo que conduce a máscaras de instancia más precisas y consistentes. Un módulo proto actualizado también permite el uso de información de múltiples escalas, por lo que el modelo maneja objetos de diferentes tamaños de manera más efectiva, incluso en escenas complejas.
- Estimación de poses: Al integrar la Estimación de Probabilidad Logarítmica Residual (RLE), una técnica que modela la incertidumbre en las predicciones de puntos clave, y mejorar el proceso de decodificación, YOLO26 ofrece puntos clave más precisos con un mejor rendimiento en tiempo real.
- Detección de cajas delimitadoras orientadas: YOLO26 introduce una pérdida de ángulo especializada que ayuda al modelo a aprender la rotación de los objetos con mayor precisión, especialmente para objetos de forma cuadrada donde la orientación puede ser ambigua. La decodificación OBB optimizada también reduce los saltos repentinos en las predicciones de ángulo cerca de los límites de rotación, lo que resulta en estimaciones de orientación más estables y consistentes.

Fig 3. Uso de Ultralytics YOLO26 para segmentación de instancias.
Link to this sectionUltralytics YOLOE-26: segmentación de vocabulario abierto construida sobre YOLO26#
Ultralytics también presenta YOLOE-26, una nueva familia de modelos de segmentación de vocabulario abierto construida sobre la arquitectura y las innovaciones de entrenamiento de YOLO26.
YOLOE-26 no es una nueva tarea o característica, sino una familia de modelos especializada que reutiliza la tarea de segmentación existente mientras permite prompts de texto, prompts visuales e inferencia sin prompts. Disponible en todos los tamaños estándar de YOLO, YOLOE-26 ofrece una mayor precisión y un rendimiento en el mundo real más fiable que los modelos anteriores de segmentación de vocabulario abierto.
Link to this sectionUltralytics YOLO26 está diseñado para donde la IA de visión realmente se ejecuta#
Desde cámaras impulsadas por visión hasta robots potenciados por visión artificial y pequeños chips de procesamiento en el borde, la visión artificial y la IA se despliegan directamente en el dispositivo para inferencia en tiempo real. Ultralytics YOLO26 está construido específicamente para estos entornos, donde la baja latencia, la eficiencia y el rendimiento fiable son vitales.
En la práctica, esto significa que YOLO26 puede desplegarse fácilmente en una amplia gama de hardware. Específicamente, a través del paquete de Python de Ultralytics y su amplia gama de integraciones, los modelos pueden exportarse a formatos optimizados para diferentes plataformas y aceleradores de hardware.
Por ejemplo, exportar a TensorRT permite una inferencia de alto rendimiento en GPUs NVIDIA, mientras que CoreML admite el despliegue nativo en dispositivos Apple, y OpenVINO optimiza el rendimiento en hardware Intel. YOLO26 también se puede exportar para ejecutarse en múltiples aceleradores de borde dedicados, lo que permite una inferencia de alto rendimiento y bajo consumo energético en hardware de IA de borde especializado.
Estos son solo algunos ejemplos, con muchas más integraciones compatibles en entornos de borde y producción. Esta flexibilidad permite que un solo modelo YOLO26 se ejecute en diversos objetivos de despliegue. Agiliza los flujos de trabajo de producción y acerca la IA de visión al borde.
Link to this sectionRedefiniendo los casos de uso de la visión artificial en todas las industrias#
Diseñado para el despliegue en el mundo real, YOLO26 puede utilizarse en una amplia gama de casos de uso de visión artificial en diferentes industrias. Aquí tienes algunos ejemplos de dónde puede aplicarse:
-
Robótica: YOLO26 puede utilizarse para tareas como navegación, detección de obstáculos e interacción con objetos. Estas capacidades respaldan operaciones robóticas seguras y efectivas en entornos dinámicos.
-
Fabricación: En las líneas de producción, YOLO26 puede analizar imágenes y vídeos para identificar defectos, componentes faltantes o problemas de proceso. Procesar datos en el dispositivo mantiene la detección rápida y reduce la dependencia de los sistemas en la nube.
-
Aplicaciones aéreas y de drones: Cuando se despliega en drones, YOLO26 puede procesar imágenes aéreas durante el vuelo para inspección, mapeo y topografía. Esto hace posible analizar escenas en tiempo real, incluso en ubicaciones remotas.
-
Sistemas embebidos e IoT: Con su diseño ligero, YOLO26 puede ejecutarse en hardware embebido de bajo consumo para procesar datos visuales localmente. Los casos de uso comunes incluyen cámaras inteligentes, sensores conectados y dispositivos de monitoreo automatizados.
-
Ciudades inteligentes: En entornos urbanos, YOLO26 puede analizar flujos de vídeo de cámaras de tráfico y espacios públicos. Esto permite aplicaciones como monitoreo de tráfico, seguridad pública y gestión de infraestructura en el borde.

Fig 4. YOLO26 puede usarse para diversas aplicaciones de visión artificial.
Link to this sectionEmpezando con Ultralytics YOLO26#
Ultralytics YOLO26 se puede utilizar a través de dos flujos de trabajo complementarios, dependiendo de cómo construyas y despliegues IA de visión.
Opción 1: Utiliza Ultralytics YOLO26 a través de Ultralytics Platform (recomendado)
Ultralytics Platform proporciona una forma centralizada de entrenar, desplegar y monitorear modelos YOLO26 en producción. Reúne conjuntos de datos, experimentos y despliegues en un solo lugar, lo que facilita la gestión de flujos de trabajo de IA de visión a gran escala, especialmente para equipos que despliegan en entornos de borde y producción.
A través de la Plataforma, los usuarios pueden:
- Acceder a modelos YOLO26
- Entrenar y ajustar con conjuntos de datos personalizados
- Exportar modelos para despliegue en el borde y producción
- Monitorear experimentos y modelos desplegados en un flujo de trabajo único
👉 Explora YOLO26 en Ultralytics Platform: platform.ultralytics.com/ultralytics/yolo26
Opción 2: Utiliza Ultralytics YOLO26 a través de flujos de trabajo de código abierto
YOLO26 sigue siendo totalmente accesible a través del ecosistema de código abierto de Ultralytics y puede utilizarse con flujos de trabajo existentes basados en Python para entrenamiento, inferencia y exportación.
Los desarrolladores pueden instalar el paquete de Ultralytics, cargar modelos YOLO26 preentrenados y desplegarlos utilizando herramientas y formatos familiares como ONNX, TensorRT, CoreML u OpenVINO.
pip install ultralyticsfrom ultralytics import YOLO
# Load a COCO-pretrained YOLO26n model
model = YOLO("yolo26n.pt")
# Run inference with the YOLO26n model on the 'bus.jpg' image
results = model("path/to/bus.jpg")Para los usuarios que prefieren un control práctico o tuberías personalizadas, la documentación completa y las guías están disponibles en la documentación de Ultralytics.
Link to this sectionUltralytics YOLO26: Construido para lo que viene en visión artificial#
Ultralytics YOLO26 está diseñado para satisfacer las necesidades de las soluciones de IA de visión del mañana, donde los modelos tendrán que ser rápidos, eficientes y fáciles de desplegar en hardware real. Al mejorar el rendimiento, simplificar el despliegue y ampliar lo que el modelo puede hacer, YOLO26 encaja de forma natural en una amplia gama de aplicaciones del mundo real. YOLO26 establece una nueva base para cómo se construye, despliega y escala la IA de visión. Estamos emocionados de ver cómo la comunidad lo utiliza para enviar sistemas de visión artificial del mundo real.
Únete a nuestra creciente comunidad y explora nuestro repositorio de GitHub para obtener recursos prácticos de IA. Para construir con IA visual hoy mismo, explora nuestras opciones de licencia. Aprende cómo la IA en la agricultura está transformando la agricultura y cómo la IA visual en robótica está dando forma al futuro visitando nuestras páginas de soluciones.






