Yolo Vision Shenzhen
Shenzhen
Únete ahora

Conozca Ultralytics YOLO26: un modelo YOLO mejor, más rápido y más pequeño

Explore el último modelo de Ultralytics YOLO , Ultralytics YOLO26, y sus características de vanguardia que favorecen un equilibrio óptimo entre velocidad, precisión y capacidad de despliegue.

El 25 de septiembre, en nuestro evento híbrido anual, YOLO Vision 2025 (YV25) en Londres, Glenn Jocher, nuestro fundador y CEO, anunció oficialmente el último avance en la serie de modelosYOLO Ultralytics Ultralytics YOLO26! Nuestro nuevo modelo de visión por ordenador, YOLO26, puede analizar e interpretar imágenes y vídeo con una arquitectura racionalizada que equilibra velocidad, precisión y facilidad de despliegue. 

Aunque Ultralytics YOLO26 simplifica aspectos del diseño del modelo y añade nuevas mejoras, también sigue ofreciendo las características familiares que los usuarios esperan de los modelos Ultralytics YOLO . Por ejemplo, Ultralytics YOLO26 es fácil de usar, admite una amplia gama de tareas de visión por ordenador y ofrece opciones flexibles de integración y despliegue. 

Ni que decir tiene que esto hace que el cambio al uso de Ultralytics YOLO26 sea sencillo, y estamos impacientes por ver cómo los usuarios lo experimentan por sí mismos cuando esté disponible públicamente a finales de octubre. 

Fig. 1. Ejemplo de utilización de YOLO26 para detect objetos en una imagen.

En pocas palabras, Ultralytics YOLO26 es un modelo de Vision AI mejor, más rápido y más pequeño. En este artículo, exploraremos las características clave de Ultralytics YOLO26 y lo que aporta. Empecemos. 

Superando los límites de la IA de visión con Ultralytics YOLO26

Antes de sumergirnos en las características clave de Ultralytics YOLO26 y las aplicaciones que hace posibles, demos un paso atrás y hablemos de la inspiración y la motivación que impulsaron el desarrollo de este modelo.

En Ultralytics, siempre hemos creído en el poder de la innovación. Desde el principio, nuestra misión ha sido doble. Por un lado, queremos que Vision AI sea accesible para que cualquiera pueda utilizarla sin barreras. Por otro lado, estamos igualmente comprometidos a mantenerla a la vanguardia, ampliando los límites de lo que los modelos de visión por ordenador pueden lograr.

Un factor clave detrás de esta misión es que el espacio de la IA está en constante evolución. Por ejemplo, la IA en el borde, que implica ejecutar modelos de IA directamente en los dispositivos en lugar de depender de la nube, se está adoptando rápidamente en todas las industrias.

Desde cámaras inteligentes hasta sistemas autónomos, se espera que los dispositivos en el edge procesen información en tiempo real. Este cambio exige modelos que sean más ligeros y rápidos, sin dejar de ofrecer el mismo alto nivel de precisión.

Por eso existe una necesidad constante de seguir mejorando nuestros modelos Ultralytics YOLO . En palabras de Glenn Jocher: "Uno de los mayores retos ha sido garantizar que los usuarios puedan sacar el máximo partido de YOLO26 sin dejar de ofrecer el máximo rendimiento."

Visión general de Ultralytics YOLO26

YOLO26 está disponible en cinco variantes de modelo diferentes, lo que le proporciona la flexibilidad necesaria para aprovechar sus capacidades en aplicaciones de cualquier escala.
Todas estas variantes de modelos admiten múltiples tareas de visión por ordenador, al igual que los modelosYOLO anteriores Ultralytics . Esto significa que, independientemente del tamaño que elija, puede confiar en que YOLO26 le ofrecerá una amplia gama de funciones, al igual que lo hace Ultralytics YOLO11.

Aquí tienes una descripción general de las tareas de visión artificial compatibles con YOLO26:

  • Detección de objetos: YOLO26 puede identificar y localizar múltiples objetos dentro de un fotograma de imagen o vídeo.
  • Segmentación de objetos: Yendo un paso más allá de la detección, YOLO26 puede generar límites perfectos en píxeles alrededor de cada objeto que identifica. 
  • Clasificación de imágenes: El modelo puede analizar una imagen completa y asignarla a una categoría o etiqueta específica.‍
  • Estimación de poses: YOLO26 puede detect puntos clave y estimar poses para humanos y otros objetos.
  • Cuadros delimitadores orientados (OBB): El modelo puede detect objetos en cualquier ángulo, lo que resulta especialmente útil para imágenes aéreas, de drones y de satélite, en las que elementos como edificios, vehículos o cultivos pueden no estar alineados con el fotograma de la imagen.‍
  • Seguimiento de objetos: YOLO26 puede utilizarse para track objetos a través de fotogramas de vídeo o secuencias en tiempo real.
Fig. 2. Detección de objetos en una imagen usando YOLO26.

Una mirada a la arquitectura de YOLO26

Ahora que comprendemos mejor de lo que es capaz YOLO26, veamos algunas de las innovaciones en su arquitectura.

El diseño del modelo se ha optimizado eliminando el módulo Distribution Focal Loss (DFL), que antes ralentizaba la inferencia y limitaba la regresión del cuadro delimitador. 

El proceso de predicción también se ha simplificado con una opción de inferencia de extremo a extremo (E2E), que permite al modelo saltarse el paso tradicional de supresión no máximaNMS). Esta mejora reduce la complejidad y permite al modelo ofrecer resultados más rápidamente, lo que facilita su implantación en aplicaciones reales.

Otras mejoras hacen que el modelo sea más inteligente y fiable. El equilibrio progresivo de la pérdida (ProgLoss) ayuda a estabilizar el entrenamiento y a mejorar la precisión, mientras que la asignación de etiquetas con reconocimiento de objetivos pequeños (STAL) garantiza que el modelo detecte los objetos pequeños con mayor eficacia. Además de esto, un nuevo optimizador MuSGD mejora la convergencia del entrenamiento e impulsa el rendimiento general.

De hecho, la versión más pequeña de YOLO26, el modelo nano, ahora se ejecuta hasta un 43% más rápido en las CPU estándar, lo que lo hace especialmente adecuado para aplicaciones móviles, cámaras inteligentes y otros dispositivos de borde donde la velocidad y la eficiencia son fundamentales.

Aquí hay un breve resumen de las características de YOLO26 y lo que los usuarios pueden esperar:

  • Eliminación de DFL: Hemos eliminado el módulo de pérdida focal de distribución de la arquitectura del modelo. Independientemente del tamaño de los objetos de una imagen, YOLO26 puede colocar cuadros delimitadores a medida con mayor eficacia.
  • Inferencia NMSMS de extremo a extremo: YOLO26 añade un modo opcional que no necesita Supresión No Máxima (NMS), un paso que normalmente se utiliza para eliminar predicciones duplicadas, lo que simplifica y acelera el despliegue para su uso en tiempo real.
  • ProgLoss y STAL: Estas mejoras hacen que el entrenamiento sea más estable y aumentan significativamente la precisión, especialmente en la detección de objetos pequeños en escenas complejas.
  • Optimizador MuSGD: YOLO26 utiliza un nuevo optimizador que combina los puntos fuertes de dos optimizadores de entrenamiento (Muon y SGD), lo que ayuda a que el modelo aprenda más rápido y alcance una mayor precisión.
Fig. 3. Evaluación comparativa de YOLO26.

Simplificación de la implantación con Ultralytics YOLO26 

Tanto si trabaja con aplicaciones móviles, cámaras inteligentes o sistemas empresariales, la implementación de YOLO26 es sencilla y flexible. El paquetePython Ultralytics admite un número cada vez mayor de formatos de exportación, lo que facilita la integración de YOLO26 en los flujos de trabajo existentes y lo hace compatible con casi cualquier plataforma. 

Algunas de las opciones de exportación incluyen TensorRT para la máxima aceleración GPU , ONNX para una amplia compatibilidad, CoreML para aplicaciones iOS nativas, TFLite para Android y dispositivos edge, y OpenVINO para un rendimiento optimizado en hardware Intel . Esta flexibilidad facilita el paso de YOLO26 del desarrollo a la producción sin obstáculos adicionales.

Otra parte crucial de la implementación es asegurarse de que los modelos se ejecuten de manera eficiente en dispositivos con recursos limitados. Aquí es donde entra en juego la cuantificación. Gracias a su arquitectura simplificada, YOLO26 maneja esto excepcionalmente bien. Admite la implementación INT8 (utilizando compresión de 8 bits para reducir el tamaño y mejorar la velocidad con una pérdida mínima de precisión), así como la media precisión (FP16) para una inferencia más rápida en hardware compatible. 

Lo más importante es que YOLO26 ofrece un rendimiento constante en estos niveles de cuantificación, por lo que puede confiar en él tanto si se ejecuta en un servidor potente como en un dispositivo edge compacto.

De la robótica a la fabricación: Casos de uso de YOLO26 

YOLO26 se puede utilizar en una amplia variedad de aplicaciones de visión artificial en muchas industrias y casos de uso diferentes. Desde la robótica hasta la fabricación, puede tener un impacto significativo al mejorar los flujos de trabajo y permitir una toma de decisiones más rápida y precisa.

Por ejemplo, un buen caso es en robótica, donde YOLO26 puede ayudar a los robots a interpretar su entorno en tiempo real. Esto facilita la navegación y hace que el manejo de objetos sea más preciso. También permite una colaboración más segura con las personas.

Otro ejemplo es la fabricación, donde el modelo se puede utilizar para la detección de defectos. Puede identificar automáticamente fallas en las líneas de producción de forma más rápida y precisa que la inspección manual.

Fig. 4. Detección de botellas en una fábrica utilizando YOLO26.

En general, debido a que YOLO26 es mejor, más rápido y más ligero, se adapta fácilmente a una amplia gama de entornos, desde dispositivos de borde ligeros hasta grandes sistemas empresariales. Esto lo convierte en una opción práctica para las industrias que buscan mejorar la eficiencia, la precisión y la fiabilidad.

Conclusiones clave 

Ultralytics YOLO26 es un modelo de visión por ordenador mejor, más rápido y más ligero, que sigue siendo fácil de usar y ofrece un gran rendimiento. Funciona en una amplia gama de tareas y plataformas y estará disponible para todo el mundo a finales de octubre. Estamos impacientes por ver cómo lo utiliza la comunidad para crear nuevas soluciones y ampliar los límites de la visión por ordenador.

¡Únase a nuestra creciente comunidad! Explore nuestro repositorio de GitHub para obtener más información sobre la IA. Descubra innovaciones como la visión artificial en el comercio minorista y la IA en la industria automotriz visitando nuestras páginas de soluciones. Para comenzar a construir con visión artificial hoy mismo, consulte nuestras opciones de licencia.

¡Construyamos juntos el futuro
de la IA!

Comience su viaje con el futuro del aprendizaje automático

Comienza gratis