Conheça o YOLO26: IA de visão de próxima geração.
Ultralytics
Voltar para o Glossário da Ultralytics

TensorRT

Explora como o TensorRT otimiza modelos de deep learning para GPUs NVIDIA. Aprende a exportar o Ultralytics YOLO26 para TensorRT para inferência de baixa latência e alta velocidade hoje mesmo.

O TensorRT é um kit de desenvolvimento de software (SDK) de inferência de deep learning de alto desempenho desenvolvido pela NVIDIA. Ele foi projetado para otimizar modelos de redes neurais para implementação, proporcionando baixa latência de inferência e alto throughput para aplicações de deep learning. Ao atuar como um compilador de otimização, o TensorRT pega redes treinadas de frameworks populares como PyTorch e TensorFlow e as reestrutura para executar de forma eficiente em GPUs NVIDIA. Essa capacidade é crucial para executar modelos de IA complexos em ambientes de produção onde a velocidade e a eficiência são primordiais.

Link to this sectionComo o TensorRT otimiza modelos#

A função principal do TensorRT é converter uma rede neural treinada em um "engine" otimizado, ajustado especificamente para o hardware de destino. Ele alcança isso através de várias técnicas avançadas:

  • Fusão de Camadas: O otimizador combina várias camadas de uma rede neural em um único kernel, reduzindo a sobrecarga de acesso à memória e melhorando a velocidade de execução.
  • Calibração de Precisão: O TensorRT suporta modos de precisão reduzida, como precisão mista (FP16) e quantização de inteiros (INT8). Ao reduzir o número de bits usados para representar números — frequentemente com perda mínima de precisão — os desenvolvedores podem acelerar significativamente as operações matemáticas e reduzir o uso de memória. Esta é uma forma de quantização de modelo.
  • Ajuste Automático de Kernel: O software seleciona automaticamente as melhores camadas de dados e algoritmos para a arquitetura de GPU específica que está sendo usada, garantindo a utilização máxima das capacidades de processamento paralelo do hardware via CUDA.

Link to this sectionAplicações no Mundo Real#

Devido à sua capacidade de processar quantidades massivas de dados com atraso mínimo, o TensorRT é amplamente adotado em indústrias que dependem de visão computacional e tarefas complexas de IA onde o tempo é crítico.

  1. Sistemas Autônomos: No domínio da IA automotiva, carros autônomos devem processar feeds de vídeo de múltiplas câmeras para detectar pedestres, sinais e obstáculos instantaneamente. Usando o TensorRT, modelos de percepção como redes de detecção de objetos podem analisar frames em milissegundos, permitindo que o sistema de controle do veículo tome decisões críticas de segurança sem atrasos.

  2. Automação Industrial: Fábricas modernas utilizam IA na manufatura para inspeção óptica automatizada. Câmeras de alta velocidade capturam imagens de produtos em linhas de montagem, e modelos otimizados pelo TensorRT identificam defeitos ou anomalias em tempo real. Isso garante que o controle de qualidade acompanhe os ambientes de produção de alta velocidade, frequentemente implementando em dispositivos de IA de borda como a plataforma NVIDIA Jetson diretamente no chão de fábrica.

Link to this sectionUsando o TensorRT com o Ultralytics YOLO#

Integrar o TensorRT ao seu fluxo de trabalho é simples com as ferramentas de IA modernas. O pacote ultralytics oferece um método fluido para converter modelos PyTorch padrão em engines TensorRT. Isso permite que os usuários aproveitem a arquitetura de ponta do Ultralytics YOLO26 com a aceleração de hardware das GPUs NVIDIA. Para equipes que buscam gerenciar seus conjuntos de dados e pipelines de treinamento antes da exportação, a Plataforma Ultralytics oferece um ambiente abrangente para preparar modelos para essa implementação de alto desempenho.

O exemplo a seguir demonstra como exportar um modelo YOLO26 para um arquivo de engine TensorRT (.engine) e usá-lo para inferência em tempo real:

from ultralytics import YOLO

# Load the latest stable YOLO26 model (nano size)
model = YOLO("yolo26n.pt")

# Export the model to TensorRT format (creates 'yolo26n.engine')
# This step optimizes the computational graph for your specific GPU
model.export(format="engine")

# Load the optimized TensorRT engine for high-speed inference
trt_model = YOLO("yolo26n.engine")

# Run inference on an image source
results = trt_model("https://ultralytics.com/images/bus.jpg")

Link to this sectionTensorRT vs. ONNX vs. Frameworks de Treinamento#

É importante distinguir o TensorRT de outros termos frequentemente ouvidos no panorama de implementação de modelos:

  • Vs. PyTorch/TensorFlow: Frameworks como o PyTorch são projetados principalmente para treinamento e pesquisa de modelos, oferecendo flexibilidade e facilidade de depuração. O TensorRT é um engine de inferência projetado exclusivamente para executar modelos treinados o mais rápido possível. Ele não é usado para treinamento.
  • Vs. ONNX: O formato ONNX (Open Neural Network Exchange) atua como uma ponte intermediária entre frameworks. Embora o ONNX forneça interoperabilidade (por exemplo, mover um modelo do PyTorch para outra plataforma), o TensorRT foca na otimização específica para hardware. Frequentemente, um modelo é convertido para ONNX primeiro e, em seguida, analisado pelo TensorRT para gerar o engine final.

Para desenvolvedores que buscam maximizar o desempenho de seus agentes de IA ou sistemas de visão, entender a transição de um framework de treinamento para um runtime otimizado como o TensorRT é um passo chave em MLOps profissional.

Explore solutions

Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais

Vamos construir o futuro da IA juntos!

Começa a tua jornada com o futuro da aprendizagem automática