Conoce YOLO26: IA de visión de nueva generación.
Ultralytics
Volver al glosario de Ultralytics

TensorRT

Explora cómo TensorRT optimiza los modelos de aprendizaje profundo para las GPU de NVIDIA. Aprende hoy a exportar Ultralytics YOLO26 a TensorRT para una inferencia de baja latencia y alta velocidad.

TensorRT es un kit de desarrollo de software (SDK) de inferencia de aprendizaje profundo de alto rendimiento desarrollado por NVIDIA. Está diseñado para optimizar modelos de redes neuronales para su implementación, ofreciendo una baja latencia de inferencia y un alto rendimiento para aplicaciones de aprendizaje profundo. Al actuar como un compilador de optimización, TensorRT toma redes entrenadas de marcos populares como PyTorch y TensorFlow y las reestructura para ejecutarlas eficientemente en GPU de NVIDIA. Esta capacidad es crucial para ejecutar modelos de IA complejos en entornos de producción donde la velocidad y la eficiencia son fundamentales.

Link to this sectionCómo optimiza los modelos TensorRT#

La función principal de TensorRT es convertir una red neuronal entrenada en un "motor" optimizado ajustado específicamente para el hardware de destino. Esto lo logra mediante varias técnicas avanzadas:

  • Fusión de capas: El optimizador combina múltiples capas de una red neuronal en un solo kernel, lo que reduce la sobrecarga de acceso a la memoria y mejora la velocidad de ejecución.
  • Calibración de precisión: TensorRT admite modos de precisión reducida, como precisión mixta (FP16) y cuantificación de enteros (INT8). Al reducir el número de bits utilizados para representar números (a menudo con una pérdida de precisión mínima), los desarrolladores pueden acelerar significativamente las operaciones matemáticas y reducir el uso de memoria. Esta es una forma de cuantificación de modelos.
  • Autoajuste de kernel: El software selecciona automáticamente las mejores capas de datos y algoritmos para la arquitectura de GPU específica que se esté utilizando, garantizando la máxima utilización de las capacidades de procesamiento paralelo del hardware a través de CUDA.

Link to this sectionAplicaciones en el mundo real#

Debido a su capacidad para procesar cantidades masivas de datos con una demora mínima, TensorRT es ampliamente adoptado en industrias que dependen de la visión artificial y tareas complejas de IA donde el tiempo es crítico.

  1. Sistemas autónomos: En el ámbito de la IA en la automoción, los coches autónomos deben procesar flujos de vídeo de múltiples cámaras para detectar peatones, señales y obstáculos al instante. Mediante el uso de TensorRT, los modelos de percepción como las redes de detección de objetos pueden analizar fotogramas en milisegundos, lo que permite al sistema de control del vehículo tomar decisiones críticas para la seguridad sin retrasos.

  2. Automatización industrial: Las fábricas modernas utilizan IA en la fabricación para la inspección óptica automatizada. Las cámaras de alta velocidad capturan imágenes de productos en las líneas de montaje y los modelos optimizados con TensorRT identifican defectos o anomalías en tiempo real. Esto garantiza que el control de calidad siga el ritmo de los entornos de producción de alta velocidad, a menudo implementándose en dispositivos de IA en el borde como la plataforma NVIDIA Jetson directamente en la planta de producción.

Link to this sectionUso de TensorRT con Ultralytics YOLO#

Integrar TensorRT en tu flujo de trabajo es sencillo con las herramientas de IA modernas. El paquete ultralytics proporciona un método fluido para convertir modelos estándar de PyTorch en motores TensorRT. Esto permite a los usuarios aprovechar la arquitectura de vanguardia de Ultralytics YOLO26 con la aceleración de hardware de las GPU de NVIDIA. Para los equipos que buscan gestionar sus conjuntos de datos y canalizaciones de entrenamiento antes de la exportación, la Plataforma Ultralytics ofrece un entorno integral para preparar modelos para dicha implementación de alto rendimiento.

El siguiente ejemplo demuestra cómo exportar un modelo YOLO26 a un archivo de motor TensorRT (.engine) y utilizarlo para inferencia en tiempo real:

from ultralytics import YOLO

# Load the latest stable YOLO26 model (nano size)
model = YOLO("yolo26n.pt")

# Export the model to TensorRT format (creates 'yolo26n.engine')
# This step optimizes the computational graph for your specific GPU
model.export(format="engine")

# Load the optimized TensorRT engine for high-speed inference
trt_model = YOLO("yolo26n.engine")

# Run inference on an image source
results = trt_model("https://ultralytics.com/images/bus.jpg")

Link to this sectionTensorRT vs. ONNX vs. Marcos de entrenamiento#

Es importante distinguir TensorRT de otros términos que se escuchan a menudo en el panorama de la implementación de modelos:

  • Vs. PyTorch/TensorFlow: Marcos como PyTorch están diseñados principalmente para el entrenamiento de modelos y la investigación, ofreciendo flexibilidad y facilidad de depuración. TensorRT es un motor de inferencia diseñado únicamente para ejecutar modelos entrenados lo más rápido posible. No se utiliza para el entrenamiento.
  • Vs. ONNX: El formato ONNX (Open Neural Network Exchange) actúa como un puente intermedio entre marcos. Si bien ONNX proporciona interoperabilidad (por ejemplo, mover un modelo de PyTorch a otra plataforma), TensorRT se centra en la optimización específica para el hardware. A menudo, un modelo se convierte primero a ONNX y luego es analizado por TensorRT para generar el motor final.

Para los desarrolladores que aspiran a maximizar el rendimiento de sus agentes de IA o sistemas de visión, comprender la transición de un marco de entrenamiento a un entorno de ejecución optimizado como TensorRT es un paso clave en MLOps profesional.

Explore solutions

Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información
Real-time AI that works with your team

IA en robótica

Potencia máquinas más inteligentes con modelos Ultralytics YOLO. La IA de visión en robótica impulsa la navegación autónoma, la percepción, el seguimiento de objetos y el control en tiempo real.

Más información
Real-time AI that works with your team

IA en logística

Optimiza la logística con los modelos de Ultralytics YOLO. La visión artificial por IA permite la inspección de paquetes, clasificación, seguimiento de vehículos y monitoreo de seguridad en almacenes en tiempo real.

Más información
Real-time AI that works with your team

IA en el sector minorista

Reimagina el comercio minorista con los modelos de Ultralytics YOLO. La visión artificial por IA potencia el seguimiento de inventario, el monitoreo de estantes, la gestión de colas y mejores perspectivas sobre los clientes.

Más información
Real-time AI that works with your team

IA en la atención sanitaria

Crea soluciones de salud con los modelos de Ultralytics YOLO. La IA de visión en la sanidad potencia imágenes médicas más rápidas, diagnósticos más inteligentes y supervisión de pacientes.

Más información
Real-time AI that works with your team

IA en la fabricación

Optimiza la fabricación con los modelos de Ultralytics YOLO. La visión artificial por IA impulsa el control de calidad, la detección de defectos, el cumplimiento del uso de PPE y la automatización de la línea de montaje.

Más información
Real-time AI that works with your operation

IA en automoción

Aplica la visión artificial en el sector automotriz con los modelos de Ultralytics YOLO. La IA de visión mejora la seguridad vial, la asistencia al conductor y la automatización de vehículos para carreteras más inteligentes.

Más información
Real-time AI tailored to your operation

IA en agricultura

Lleva la visión artificial a la agricultura inteligente con los modelos de Ultralytics YOLO. Potencia el seguimiento de cultivos, el control del ganado y la agricultura de precisión para obtener rendimientos mayores y más inteligentes.

Más información

¡Construyamos juntos el futuro de la IA!

Comienza tu viaje con el futuro del aprendizaje automático