Acelerar Ultralytics YOLO26 com OpenVINO em Intel Core Ultra Series 3 (Panther Lake)
Descobre como exportar modelos Ultralytics YOLO26 para o formato OpenVINO e acelerar a inferência em hardware Intel, incluindo CPU, GPU e NPU.

Ao longo dos últimos anos, a IA e a visão computacional deixaram de ser experimentais para se tornarem uma parte fundamental das operações comerciais diárias. Na verdade, pesquisas mostram que cerca de 88% das organizações já utilizam IA em pelo menos uma parte dos seus negócios.
No entanto, transformar essa adoção em valor real, seja em sistemas de produção ou projetos pessoais, muitas vezes depende de quão bem os modelos realmente funcionam após a implementação. Em muitos cenários do mundo real, modelos de visão computacional como o Ultralytics YOLO26 são implementados em dispositivos de borda e numa variedade de hardwares, frequentemente CPUs, GPUs integradas ou NPUs, em vez de GPUs de alto desempenho.
É aqui que o desempenho pode começar a variar e onde a otimização se torna crítica. Um modelo que funciona bem num ambiente pode ter dificuldades noutro se não estiver devidamente otimizado para o hardware subjacente.
Para simplificar isso, o pacote Python da Ultralytics oferece suporte à exportação de modelos YOLO26 para formatos otimizados como o OpenVINO, para que possam ser executados sem problemas em hardwares Intel sem a necessidade de alterações no seu fluxo de trabalho.
Por exemplo, quando um modelo YOLO26 é exportado para o formato OpenVINO, ele pode ser executado com mais eficiência em processadores Intel Core Ultra Series 3, com velocidades de inferência de GPU aumentando em até três vezes.
Neste artigo, exploraremos como a integração atualizada entre Ultralytics e OpenVINO torna mais fácil implementar modelos YOLO26 em hardwares Intel Core Ultra Series 3. Vamos começar!
Link to this sectionUma visão geral da integração Ultralytics x OpenVINO#
O pacote Python da Ultralytics fornece uma interface única para treinamento, execução de inferência e implementação de modelos Ultralytics YOLO como o YOLO26. Ele suporta uma variedade de integrações que auxiliam em diferentes partes do fluxo de trabalho de IA de visão, desde o treinamento e experimentação até a implementação e otimização.
Uma das integrações focadas em implementação é com o toolkit OpenVINO, que permite exportar modelos YOLO26 para um formato otimizado para hardware Intel. Este processo converte modelos YOLO num formato que é executado com maior eficiência em CPUs, GPUs e NPUs Intel, incluindo sistemas alimentados por processadores Intel® Core™ Ultra™ series.
Isso torna mais simplificado executar modelos em diferentes dispositivos Intel sem a necessidade de ajustá-los manualmente para cada configuração. Esteja você trabalhando numa máquina local, num dispositivo de borda ou numa implementação maior, o mesmo modelo exportado pode ser reutilizado.
O que torna esta integração especialmente prática é a forma como ela se encaixa perfeitamente no fluxo de trabalho existente da Ultralytics. Você pode exportar um modelo usando a mesma interface que usa para treinamento e inferência, sem precisar de ferramentas adicionais ou de uma configuração complexa.
Uma vez exportado, o modelo pode ser usado para inferência através do pacote Python da Ultralytics ou do OpenVINO Runtime, dependendo de quanto controle e flexibilidade você precisa.
Link to this sectionUm olhar mais atento sobre o OpenVINO e o hardware Intel Panther Lake para inferência de IA#
Antes de vermos quão eficientemente um modelo YOLO26 exportado pode ser executado em hardware Intel, vamos dar um passo atrás e entender como o OpenVINO e o hardware Intel trabalham juntos para permitir uma inferência eficiente.
O OpenVINO é um toolkit de código aberto projetado para otimizar e executar inferência de IA em hardwares Intel, incluindo CPUs, GPUs integradas e NPUs. Ele fornece um ambiente de execução unificado, para que o mesmo modelo possa ser executado nessas diferentes unidades de computação sem precisar ser reescrito.

Fig 1. O OpenVINO facilita a implementação de modelos em múltiplos alvos de hardware. (Fonte)
Nos novos processadores Intel® Core™ Ultra™ Series 3 (codinome Panther Lake), as cargas de trabalho de IA são executadas em múltiplas unidades de computação dentro do mesmo processador. Cada chip combina núcleos de CPU para tarefas de uso geral, uma GPU integrada para processamento paralelo e uma NPU dedicada projetada especificamente para inferência de IA.
O OpenVINO fornece uma API unificada que permite direcionar qualquer uma dessas unidades de computação, seja CPU, GPU ou NPU, sem alterar seu código. Você pode simplesmente especificar em qual dispositivo executar a inferência durante a execução, tornando simples alternar entre os três, dependendo das suas necessidades de desempenho e eficiência.
Link to this sectionBenchmarking do YOLO26 na série Intel® Core™ Ultra™#
À medida que explora a integração Ultralytics e OpenVINO, você pode se perguntar: que tipo de ganhos de desempenho de modelo você pode esperar ao exportar o YOLO26 para o formato OpenVINO?
A diferença na velocidade de inferência torna-se clara ao comparar modelos YOLO26 em diferentes formatos e níveis de precisão. Por exemplo, ao executar a variante nano do YOLO26 (YOLO26n) num Intel Core Ultra X7 358H, um processador Panther Lake, o tempo de inferência cai de 25,18 ms por imagem em PyTorch na precisão FP32 para 2,64 ms com OpenVINO na mesma precisão com a NPU integrada.
Isso é mais rápido que a linha de base original do PyTorch FP32, o que pode fazer uma diferença notável em aplicações em tempo real e de borda onde a latência é crítica. Esses ganhos tornam-se ainda mais aparentes ao executar o mesmo modelo na GPU Intel Arc integrada.

Fig 2. Benchmarking da inferência do YOLO26 na GPU Intel Panther Lake usando OpenVINO (Fonte)

Fig 3. Benchmarking da inferência do YOLO26 na NPU Intel Panther Lake usando OpenVINO (Fonte)
Link to this sectionExplorando duas formas de exportar o Ultralytics YOLO26 para o formato OpenVINO#
Existem duas formas principais de exportar modelos YOLO26 para o formato OpenVINO. Você pode usar o pacote Python da Ultralytics ou exportar diretamente através da Plataforma Ultralytics, um espaço de trabalho completo para construir e gerenciar fluxos de trabalho de visão computacional num só lugar. A seguir, abordaremos ambas as formas.
Link to this sectionUsando o pacote Python da Ultralytics para exportar o YOLO26#
O pacote Python da Ultralytics fornece uma forma simples de exportar modelos YOLO26 para o formato OpenVINO dentro de um fluxo de trabalho baseado em código. Como a mesma interface é usada para treinamento e inferência, a exportação de um modelo encaixa-se naturalmente nos fluxos existentes sem exigir ferramentas adicionais.
Para começar, você pode instalar o pacote Ultralytics. Isso pode ser feito executando o comando “pip install ultralytics” num terminal ou prompt de comando. Se estiver trabalhando num ambiente interativo como Jupyter Notebook ou Google Colab, você pode executar o mesmo comando prefixando-o com um ponto de exclamação.
Uma vez instalado, você pode carregar um modelo YOLO26 treinado e exportá-lo diretamente para o formato OpenVINO. Como mostrado abaixo, um modelo YOLO26n pré-treinado (yolo26n.pt) é carregado e depois convertido para o formato OpenVINO usando o método de exportação.
from ultralytics import YOLO
model = YOLO("yolo26n.pt")
model.export(format="openvino")Após executar o código, o modelo convertido é salvo num novo diretório, onde pode ser usado para implementação.
Link to this sectionExportando o YOLO26 na Plataforma Ultralytics#
Se você procura uma abordagem mais simples e sem código, pode exportar modelos YOLO26 diretamente através da Plataforma Ultralytics. A plataforma reúne todo o fluxo de trabalho de visão computacional num único espaço de trabalho, facilitando a transição do treinamento para a implementação sem configuração adicional.
Assim que o seu modelo estiver pronto, você pode abri-lo dentro da plataforma e navegar até a guia Exportar. A partir daí, você pode selecionar OpenVINO como o formato de exportação e, opcionalmente, ajustar configurações como tamanho da imagem ou precisão.

Fig 4. Uma visão sobre a exportação do YOLO26 dentro da Plataforma Ultralytics
A plataforma gerencia a conversão automaticamente, portanto não há necessidade de gerenciar scripts, dependências ou configuração de ambiente. Após a conclusão da exportação, o modelo otimizado pode ser baixado e usado para implementação em CPUs, GPUs e NPUs Intel.
Link to this sectionOpções de implementação habilitadas pela integração Ultralytics x OpenVINO#
Uma vez que um modelo YOLO26 foi exportado para o formato OpenVINO, existem algumas maneiras de executar a inferência, dependendo do seu fluxo de trabalho e do nível de controle necessário. Você pode usar o pacote Python da Ultralytics para uma abordagem mais simples e integrada ou usar o ambiente de execução OpenVINO nativo para mais flexibilidade e controle.
Link to this sectionExecutando inferência com o pacote Python da Ultralytics#
Assim que seu modelo for exportado para o formato OpenVINO, você pode executar a inferência usando o pacote Python da Ultralytics. Esta abordagem é ideal para testes rápidos e implementação simplificada, uma vez que utiliza a mesma interface que o treinamento e a exportação.
Com esta abordagem, você pode carregar o modelo OpenVINO exportado a partir de seu diretório e executar a inferência numa entrada como uma imagem ou vídeo. Você também pode escolher em qual dispositivo executar, especificando opções como "intel:cpu", "intel:gpu" ou "intel:npu", dependendo do hardware disponível no seu sistema.
O snippet de código abaixo mostra como carregar o modelo exportado e executar a inferência numa imagem enquanto direciona a GPU. Após a conclusão da inferência, a imagem de saída é salva no diretório “runs/detect/predict”.
ov_model = YOLO("yolo26n_openvino_model/")
results = ov_model("https://ultralytics.com/images/bus.jpg", device="intel:gpu")Link to this sectionAproveitando o pacote OpenVINO nativo para inferência#
Se precisar de mais controle sobre como seu modelo é executado na produção, você pode usar o ambiente de execução OpenVINO nativo para inferência. Este método é útil ao integrar modelos em aplicações maiores ou quando você deseja ajustar como a inferência é executada em hardwares específicos.
O OpenVINO fornece uma maneira unificada de executar modelos em CPUs, GPUs e NPUs Intel, juntamente com recursos como execução assíncrona e uso eficiente dos recursos de computação disponíveis. Para configurar isso, você pode trabalhar diretamente com os arquivos de modelo exportados, incluindo o arquivo .xml que define a estrutura do modelo e o arquivo .bin que contém os pesos treinados.
Dependendo do seu caso de uso, você também pode ajustar configurações como tamanho da entrada ou etapas de pré-processamento. A configuração da inferência envolve a inicialização do ambiente de execução OpenVINO, o carregamento e compilação do modelo para um dispositivo alvo, a preparação dos dados de entrada e, então, a execução da inferência.

Fig 5. Um exemplo de um pipeline de inferência típico com OpenVINO (Fonte)
Isso permite que você controle como o modelo é executado e como ele se ajusta à sua implementação geral. Para saber mais sobre como configurar e executar a inferência com o ambiente de execução OpenVINO, você pode explorar a documentação oficial da Ultralytics.
Link to this sectionAplicações do mundo real do YOLO26 em hardware Intel#
O valor real da integração entre a Ultralytics e o OpenVINO aparece na produção, onde uma inferência confiável e de baixa latência pode fazer uma diferença tangível. Aqui está uma olhada em algumas indústrias-chave onde essa integração gera resultados significativos:
-
Manufatura: Ao exportar o YOLO26 para OpenVINO, os sistemas da linha de produção podem detectar automaticamente defeitos visuais, como componentes ausentes, desalinhamento ou danos na superfície em hardware Intel, ajudando a melhorar a qualidade do produto e reduzir erros dispendiosos.
-
Saúde: Sistemas de monitoramento de pacientes e imagens médicas podem executar modelos YOLO26 exportados localmente em hardware Intel, apoiando requisitos rigorosos de privacidade de dados enquanto mantêm um desempenho de inferência confiável.
-
Cidades inteligentes: O monitoramento de tráfego e a análise de multidões podem ser implementados usando modelos YOLO26 exportados em câmeras de borda alimentadas pela Intel, permitindo insights em tempo real, como contagem de veículos, rastreamento de pedestres e detecção de incidentes.
-
Automotivo: A baixa latência e a eficiência energética são críticas no monitoramento do motorista e na detecção dentro da cabine, tornando o hardware Intel emparelhado com modelos YOLO26 exportados uma excelente opção para sistemas automotivos embarcados.
Se você quiser saber mais sobre essa integração, junte-se a nós na série de workshops OpenVINO DevCon da Intel, “Da Anotação à Implementação: Construindo um Pipeline de Detecção de Objetos com Geti, YOLO26 e OpenVINO™”, onde nosso Gerente de Parcerias e Ecossistema, Francesco Mattioli, se juntará ao AI Software Evangelist da Intel, Adrian Boguszewski, para uma demonstração ao vivo e um passo a passo de como construir pipelines de visão computacional prontos para produção em cenários industriais do mundo real. O workshop contará com um fluxo de trabalho completo de detecção de objetos de ponta a ponta, desde a criação de conjuntos de dados e treinamento de modelos até a otimização e implementação na borda.
Link to this sectionBenefícios do uso do formato de exportação OpenVINO#
Aqui estão algumas das principais vantagens de usar o formato de exportação OpenVINO:
-
Acessível e fácil de integrar: Com uma API unificada e mais de 80 notebooks de tutoriais, o OpenVINO torna mais fácil passar da experimentação para a implementação sem introduzir complexidade significativa.
-
Execute o mesmo modelo em diferentes hardwares: O OpenVINO permite que você use um único modelo exportado em hardware Intel compatível, implementando-o em CPUs, GPUs ou NPUs sem precisar reescrever ou adaptar para cada dispositivo.
-
Otimização integrada durante a exportação: Exportar para o OpenVINO converte modelos de frameworks populares como PyTorch e TensorFlow num formato otimizado pronto para inferência, eliminando a necessidade de etapas de conversão separadas.
-
Melhor utilização dos recursos de hardware: O OpenVINO suporta inferência assíncrona e balanceamento de carga em hardware Intel, ajudando a melhorar a eficiência em aplicações do mundo real.
Link to this sectionExecutando o YOLO26 com ExecuTorch e o backend OpenVINO#
Se você estiver implementando o YOLO26 em ambientes de produção mais exigentes, existe outra opção disponível que combina eficiência no dispositivo com compressão avançada de modelo.
ExecuTorch, o framework de inferência no dispositivo do PyTorch, suporta um backend OpenVINO que permite implementar o YOLO26 em hardware Intel através de um caminho diferente de exportação e execução.
A forma como funciona é que o ExecuTorch lida com a exportação do modelo e a execução, enquanto o OpenVINO atua como a camada de aceleração de hardware por baixo, gerenciando a computação real em CPU, GPU ou NPU Intel. Os dois trabalham juntos para que você obtenha a portabilidade e a eficiência no dispositivo do ExecuTorch combinadas com as otimizações específicas de hardware que o OpenVINO oferece.
Para saber mais sobre como isso funciona e como começar com o YOLO26 no ExecuTorch e no backend OpenVINO, confira o blog da Intel cobrindo as atualizações mais recentes de ExecuTorch e OpenVINO.
Link to this sectionPrincipais pontos#
Exportar modelos YOLO26 através da integração Ultralytics e OpenVINO melhora o desempenho em hardware Intel sem adicionar complexidade ao seu fluxo de trabalho. Você pode passar do treinamento à implementação sem refazer seu pipeline. No geral, isso fornece uma maneira direta de executar modelos eficientemente em CPUs, GPUs e NPUs Intel em aplicações do mundo real.
Junte-se à nossa comunidade e explore nosso repositório no GitHub para saber mais sobre Vision AI. Confira nossas opções de licenciamento para iniciar seus projetos de visão computacional. Interessado em inovações como IA na manufatura ou visão computacional no setor automotivo? Visite nossas páginas de soluções para descobrir mais.






