Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Integraciones

Optimización de modelos Ultralytics YOLO con la integración de TensorRT

Aprende a exportar modelos Ultralytics YOLO utilizando la integración de TensorRT para obtener un rendimiento de IA más rápido y eficiente en GPU de NVIDIA para aplicaciones en tiempo real.

ABAbirami Vina
5 min read
Optimización de modelos Ultralytics YOLO con la integración de TensorRT

Imagina un coche autónomo moviéndose por una calle con mucho tráfico y que solo tiene milisegundos para detectar a un peatón que baja a la calzada. Al mismo tiempo, podría necesitar reconocer una señal de stop parcialmente oculta por un árbol o reaccionar rápidamente ante un vehículo cercano que se desvía hacia su carril. En situaciones así, la velocidad y las respuestas en tiempo real son fundamentales.

Aquí es donde la inteligencia artificial (IA), concretamente la visión por ordenador, una rama de la IA que ayuda a las máquinas a interpretar datos visuales, desempeña un papel clave. Para que las soluciones de visión por ordenador funcionen de forma fiable en entornos reales, a menudo necesitan procesar la información rápidamente, gestionar múltiples tareas a la vez y utilizar la memoria de forma eficiente.

Una forma de lograrlo es mediante la aceleración por hardware, utilizando dispositivos especializados como unidades de procesamiento gráfico (GPU) para ejecutar modelos más rápido. Las GPU de NVIDIA son especialmente conocidas para este tipo de tareas, gracias a su capacidad para ofrecer una baja latencia y un alto rendimiento.

Sin embargo, ejecutar un modelo en una GPU tal cual no siempre garantiza un rendimiento óptimo. Los modelos de visión por IA suelen requerir optimización para aprovechar al máximo las capacidades de los dispositivos de hardware. Para lograr el máximo rendimiento con un hardware específico, necesitamos compilar el modelo para utilizar el conjunto concreto de instrucciones de dicho hardware.

Por ejemplo, TensorRT es un formato de exportación y una biblioteca de optimización desarrollada por NVIDIA para mejorar el rendimiento en máquinas de alta gama. Utiliza técnicas avanzadas para reducir significativamente el tiempo de inferencia manteniendo la precisión.

NVIDIA TensorRT permite que los modelos se ejecuten de forma óptima en dispositivos NVIDIA

Fig 1. NVIDIA TensorRT permite que los modelos se ejecuten de forma óptima en varios dispositivos NVIDIA.

En este artículo, exploraremos la integración de TensorRT compatible con Ultralytics y veremos paso a paso cómo puedes exportar tu modelo YOLO11 para un despliegue más rápido y eficiente en hardware de NVIDIA. ¡Empecemos!

Link to this sectionUna visión general de TensorRT#

TensorRT es un conjunto de herramientas desarrollado por NVIDIA para ayudar a que los modelos de IA se ejecuten de forma más rápida y eficiente en las GPU de NVIDIA. Está diseñado para aplicaciones del mundo real donde la velocidad y el rendimiento son realmente importantes, como los coches autónomos y el control de calidad en la fabricación y la industria farmacéutica.

TensorRT incluye herramientas como compiladores y optimizadores de modelos que pueden trabajar en segundo plano para asegurar que tus modelos funcionen con baja latencia y puedan manejar un mayor rendimiento.

La integración de TensorRT compatible con Ultralytics funciona optimizando tu modelo YOLO para que se ejecute de forma más eficiente en las GPU utilizando métodos como la reducción de precisión. Esto se refiere al uso de formatos de menos bits, como coma flotante de 16 bits (FP16) o enteros de 8 bits (INT8), para representar los datos del modelo, lo que reduce el uso de memoria y acelera el cálculo con un impacto mínimo en la precisión.

Además, las capas de red neuronal compatibles se fusionan en modelos optimizados de TensorRT para reducir el uso de memoria, lo que resulta en una inferencia más rápida y eficiente.

Un vistazo a la técnica de fusión de capas de TensorRT

Fig 2. Un vistazo a la técnica de fusión de capas de TensorRT.

Link to this sectionCaracterísticas clave del formato de exportación TensorRT#

Antes de discutir cómo puedes exportar YOLO11 utilizando la integración de TensorRT, echemos un vistazo a algunas características clave del formato de modelo TensorRT:

  • Fácil integración con frameworks: TensorRT admite la integración directa con marcos de IA populares como PyTorch, Hugging Face y ONNX, ofreciendo un rendimiento hasta 6 veces más rápido. También es compatible con MATLAB, lo que permite el desarrollo de motores de IA de alta velocidad en plataformas como Jetson, NVIDIA DRIVE y centros de datos.

  • Despliegue escalable con Triton: Los modelos optimizados en formato TensorRT pueden desplegarse a escala utilizando NVIDIA Triton Inference Server, que mejora la eficiencia a través de funciones como el procesamiento por lotes de entrada, la ejecución simultánea de modelos, la compatibilidad con conjuntos de modelos y la transmisión de audio/vídeo en tiempo real.

  • Flexible en todos los dispositivos: Desde pequeños dispositivos edge hasta servidores potentes, TensorRT funciona en todo el ecosistema de NVIDIA, admitiendo herramientas como DeepStream para vídeo, Riva para IA de voz y otras para ciberseguridad, recomendaciones y mucho más.

Link to this section¿Cómo funciona la integración de TensorRT?#

Exportar modelos Ultralytics YOLO como Ultralytics YOLO11 al formato de modelo TensorRT es sencillo. Vamos a seguir los pasos necesarios.

Para empezar, puedes instalar el paquete Python de Ultralytics utilizando un gestor de paquetes como «pip». Esto se puede hacer ejecutando el comando «pip install ultralytics» en tu símbolo del sistema o terminal.

Tras instalar correctamente el paquete Python de Ultralytics, puedes entrenar, probar, ajustar, exportar y desplegar modelos para diversas tareas de visión por ordenador, como la detección de objetos, la clasificación y la segmentación de instancias. Si encuentras alguna dificultad durante la instalación del paquete, puedes consultar la guía de problemas comunes para obtener soluciones y consejos.

Para el siguiente paso, necesitarás un dispositivo NVIDIA. Utiliza el fragmento de código que aparece a continuación para cargar y exportar YOLO11 al formato de modelo TensorRT. Carga una variante nano preentrenada del modelo YOLO11 (yolo11n.pt) y la exporta como un archivo de motor TensorRT (yolo11n.engine), dejándolo listo para su despliegue en dispositivos NVIDIA.

from ultralytics import YOLO

model = YOLO("yolo11n.pt")
model.export(format="engine")

Después de convertir tu modelo al formato TensorRT, puedes desplegarlo para diversas aplicaciones.

El ejemplo siguiente muestra cómo cargar el modelo YOLO11 exportado (yolo11n.engine) y ejecutar una inferencia utilizando dicho modelo. La inferencia consiste en usar el modelo entrenado para realizar predicciones sobre datos nuevos. En este caso, utilizaremos una imagen de entrada de un perro para probar el modelo.

tensorrt_model = YOLO("yolo11n.engine")
results = tensorrt_model("https://images.pexels.com/photos/1254140/pexels-photo-1254140.jpeg?auto=compress&cs=tinysrgb&w=1260&h=750&dpr=2.jpg", save=True)

Cuando ejecutes este código, la siguiente imagen de salida se guardará en la carpeta runs/detect/predict.

Ejecutando una inferencia usando el modelo YOLO11 exportado en formato TensorRT

Fig 3. Resultado de ejecutar una inferencia utilizando el modelo YOLO11 exportado en formato TensorRT.

Link to this section¿Cuándo aprovechar la integración de TensorRT?#

El paquete Python de Ultralytics admite varias integraciones que permiten exportar modelos YOLO a diferentes formatos como TorchScript, CoreML, ONNX y TensorRT. Entonces, ¿cuándo deberías elegir utilizar la integración de TensorRT?

Aquí tienes algunos factores que distinguen al formato de modelo TensorRT de otras opciones de integración de exportación:

  • Tamaño de modelo más pequeño: Exportar un modelo YOLO al formato TensorRT con precisión INT8 puede reducir significativamente el tamaño del modelo. La cuantización de FP32 a INT8 puede conducir a una reducción de 4 veces en el tamaño del modelo, lo que permite tiempos de descarga más rápidos, menores requisitos de almacenamiento y una huella de memoria reducida durante el despliegue.

  • Menor consumo de energía: La cuantización INT8 no solo reduce el tamaño del modelo, sino que también disminuye el consumo de energía. Las operaciones de precisión reducida para modelos YOLO exportados en INT8 pueden consumir menos energía en comparación con los modelos FP32, lo cual es especialmente beneficioso para dispositivos alimentados por batería como drones, teléfonos inteligentes o dispositivos edge.

  • Rendimiento más rápido: Combinar la arquitectura eficiente de YOLO con la optimización INT8 de TensorRT puede mejorar las velocidades de inferencia.

Link to this sectionAplicaciones de YOLO11 y el formato de modelo TensorRT#

Los modelos Ultralytics YOLO exportados al formato TensorRT pueden desplegarse en una amplia gama de escenarios del mundo real. Estos modelos optimizados son especialmente útiles allí donde un rendimiento de IA rápido y eficiente es clave. Exploremos algunos ejemplos interesantes de cómo se pueden utilizar.

Link to this sectionCajas de pago inteligentes en tiendas minoristas#

Una amplia gama de tareas en tiendas minoristas, como escanear códigos de barras, pesar productos o empaquetar artículos, sigue siendo realizada manualmente por el personal. Sin embargo, depender exclusivamente de los empleados puede ralentizar las operaciones y provocar frustración en los clientes, especialmente en la caja. Las largas colas son incómodas tanto para los compradores como para los propietarios de las tiendas. Las cajas de pago automáticas inteligentes son una gran solución para este problema.

Estos mostradores utilizan visión por ordenador y GPU para acelerar el proceso, ayudando a reducir los tiempos de espera. La visión por ordenador permite a estos sistemas ver y entender su entorno a través de tareas como la detección de objetos. Los modelos avanzados como YOLO11, cuando se optimizan con herramientas como TensorRT, pueden ejecutarse mucho más rápido en dispositivos GPU.

Estos modelos exportados son muy adecuados para configuraciones de venta minorista inteligente que utilizan dispositivos de hardware compactos pero potentes, como el NVIDIA Jetson Nano, diseñado específicamente para aplicaciones de IA edge.

Un ejemplo de un mostrador de pago inteligente

Fig 4. Un ejemplo de caja de pago inteligente.

Link to this sectionDetección automatizada de defectos en la fabricación#

Un modelo de visión por ordenador como YOLO11 puede entrenarse a medida para detectar productos defectuosos en la industria manufacturera. Una vez entrenado, el modelo puede exportarse al formato TensorRT para su despliegue en instalaciones equipadas con sistemas de IA de alto rendimiento.

A medida que los productos se mueven por las cintas transportadoras, las cámaras capturan imágenes y el modelo YOLO11, ejecutándose en formato TensorRT, las analiza en tiempo real para detectar defectos. Esta configuración permite a las empresas detectar problemas de forma rápida y precisa, reduciendo los errores y mejorando la eficiencia.

Del mismo modo, industrias como la farmacéutica están utilizando este tipo de sistemas para identificar defectos en envases médicos. De hecho, se prevé que el mercado mundial de sistemas inteligentes de detección de defectos crezca hasta los 5.000 millones de dólares para 2026.

Usando YOLO para detectar defectos en la industria farmacéutica

Fig 5. Uso de YOLO para detectar defectos en la industria farmacéutica.

Link to this sectionConsideraciones a tener en cuenta al utilizar TensorRT#

Aunque la integración de TensorRT aporta muchas ventajas, como velocidades de inferencia más rápidas y una menor latencia, aquí tienes algunas limitaciones a tener en cuenta:

  • Ligera disminución de la precisión: Cuando exportas tu modelo en formato TensorRT, es posible que el modelo exportado no sea tan preciso como el original. Métricas de rendimiento como la precisión, el recuerdo y la capacidad del modelo para detectar objetos (puntuaciones mAP) podrían disminuir ligeramente. Esto puede mitigarse utilizando un conjunto de datos representativo durante la cuantización.

  • Mayor complejidad de depuración: Las optimizaciones realizadas por TensorRT pueden hacer que sea más difícil rastrear errores o entender comportamientos inesperados, especialmente al comparar los resultados con el modelo original.

  • Sensibilidad al tamaño del lote (batch size): Las ganancias de rendimiento de TensorRT son más pronunciadas con tamaños de lote más grandes. Para aplicaciones que procesan imágenes individuales o lotes pequeños, las mejoras de rendimiento podrían ser menos significativas.

Link to this sectionConclusiones clave#

Exportar modelos Ultralytics YOLO al formato TensorRT hace que se ejecuten significativamente más rápido y de forma más eficiente, lo que los hace ideales para tareas en tiempo real como la detección de defectos en fábricas, potenciar sistemas de cajas inteligentes o monitorizar zonas urbanas concurridas.

Esta optimización ayuda a que los modelos funcionen mejor en las GPU de NVIDIA al acelerar las predicciones y reducir el uso de memoria y energía. Aunque existen algunas limitaciones, el aumento de rendimiento hace que la integración de TensorRT sea una excelente opción para cualquiera que construya sistemas de visión por ordenador de alta velocidad en hardware de NVIDIA.

¿Quieres saber más sobre IA? Explora nuestro repositorio de GitHub, conecta con nuestra comunidad y consulta nuestras opciones de licencia para impulsar tu proyecto de visión por ordenador. Obtén más información sobre innovaciones como la IA en la fabricación y la visión por ordenador en la industria logística en nuestras páginas de soluciones.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.
Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.
Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.
Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.
Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.
Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.
Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.
Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático