Conheça o YOLO26: IA de visão de próxima geração.
Ultralytics
Voltar para o Glossário da Ultralytics

Inference Engine

Descobre como um motor de inferência otimiza modelos de aprendizagem automática como o Ultralytics YOLO26 para implementação em tempo real. Explora dicas de desempenho para IA de Edge hoje.

Um motor de inferência é um componente de software especializado, concebido para executar modelos de machine learning treinados e gerar previsões a partir de novos dados. Ao contrário da fase de treino, que se foca na aprendizagem de padrões através de processos computacionalmente intensivos como a backpropagation, um motor de inferência está estritamente otimizado para a fase operacional conhecida como model deployment. O seu objetivo principal é realizar cálculos da forma mais eficiente possível, minimizando a inference latency e maximizando o débito no hardware de destino, seja ele um servidor na cloud escalável ou um dispositivo de Edge AI alimentado a bateria. Ao eliminar a sobrecarga necessária para o treino, estes motores permitem que neural networks complexas funcionem em aplicações em tempo real.

Link to this sectionComo os Motores de Inferência Otimizam o Desempenho#

A transição de um ambiente de treino para um motor de inferência envolve tipicamente vários passos de otimização para simplificar a estrutura do modelo. Como o modelo já não precisa de aprender, o motor pode descartar os dados necessários para as atualizações de gradiente, congelando efetivamente os model weights. As técnicas comuns utilizadas pelos motores de inferência incluem a fusão de camadas, onde múltiplas operações são combinadas num único passo para reduzir o acesso à memória, e a model quantization, que converte os pesos de formatos de vírgula flutuante de alta precisão para números inteiros de menor precisão (por exemplo, INT8).

Estas otimizações permitem que arquiteturas avançadas como o Ultralytics YOLO26 funcionem a velocidades incrivelmente elevadas sem perda significativa de accuracy. Diferentes motores são frequentemente adaptados a ecossistemas de hardware específicos para desbloquear o desempenho máximo:

  • NVIDIA TensorRT: Fornece inferência de alto desempenho em GPUs NVIDIA através da utilização de kernels específicos do hardware e da otimização do gráfico da rede.
  • Intel OpenVINO: Otimiza o desempenho de deep learning em arquiteturas Intel, incluindo CPUs e gráficos integrados, tornando-o ideal para computação edge.
  • ONNX Runtime: Um acelerador multiplataforma que suporta modelos no formato ONNX, fornecendo uma ponte entre diferentes frameworks e backends de hardware.

Link to this sectionAplicações no Mundo Real#

Os motores de inferência são os motores silenciosos por detrás de muitas conveniências modernas da IA, permitindo que os sistemas de computer vision reajam instantaneamente ao seu ambiente.

  1. Veículos Autónomos: Em carros de condução autónoma, os modelos de object detection devem identificar peões, sinais de trânsito e outros veículos em milissegundos. Um motor de inferência a correr localmente no hardware do carro garante que este processamento acontece com velocidades de real-time inference, uma vez que depender de uma ligação à cloud introduziria atrasos perigosos.

  2. Manufatura Inteligente: As fábricas utilizam câmaras de industrial IoT para inspecionar produtos nas linhas de montagem. Um motor de inferência processa fluxos de vídeo para realizar anomaly detection, sinalizando defeitos instantaneamente. Esta automatização reduz o desperdício e garante um controlo de qualidade rigoroso sem atrasar a produção.

Link to this sectionMotor de Inferência Vs. Framework de Treino#

É útil distinguir entre o software utilizado para criar o modelo e o motor utilizado para o executar. Uma Training Framework (como o PyTorch ou TensorFlow) fornece as ferramentas para projetar arquiteturas, calcular perdas e atualizar parâmetros através de supervised learning. Dá prioridade à flexibilidade e às capacidades de depuração.

Em contrapartida, o Inference Engine recebe o artefacto final da framework de treino e dá prioridade à velocidade de execução e à eficiência da memória. Embora possas executar a inferência dentro de uma framework de treino, raramente é tão eficiente como utilizar um motor dedicado, especialmente para implementação em telemóveis ou dispositivos embebidos através de ferramentas como o TensorFlow Lite ou o Apple Core ML.

Link to this sectionUtilizar um Motor de Inferência com o YOLO26#

O pacote ultralytics abstrai grande parte da complexidade dos motores de inferência, permitindo que os utilizadores executem previsões sem problemas. Internamente, gere o pré-processamento de imagens e a execução do modelo. Para os utilizadores que procuram escalar, a Ultralytics Platform simplifica o processo de treino e exportação de modelos para formatos otimizados compatíveis com vários motores de inferência.

O exemplo seguinte demonstra como carregar um modelo YOLO26 pré-treinado e executar a inferência numa imagem:

from ultralytics import YOLO

# Load the YOLO26n model (nano version for speed)
model = YOLO("yolo26n.pt")

# Run inference on an image from a URL
# The 'predict' method acts as the interface to the inference process
results = model.predict("https://ultralytics.com/images/bus.jpg")

# Display the results
results[0].show()

Explore solutions

Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais

Vamos construir o futuro da IA juntos!

Começa a tua jornada com o futuro da aprendizagem automática