Sintonize na YOLO Vision 2025!
25 de setembro de 2025
10:00 — 18:00 BST
Evento híbrido
Yolo Vision 2024

Executando modelos Ultralytics YOLO no PC com IA da Intel com OpenVino

Abirami Vina

4 min de leitura

9 de outubro de 2024

Reveja a apresentação de Dmitriy Pastushenkov e Adrian Boguszewski no YOLO Vision 2024 sobre a otimização de modelos YOLO com Intel OpenVino e a execução de inferências em tempo real no AI PC da Intel.

O YOLO Vision 2024 (YV24), o evento híbrido anual da Ultralytics, reuniu entusiastas de IA, desenvolvedores e especialistas de todo o mundo para explorar as últimas inovações em visão computacional. O YV24 foi uma excelente oportunidade e plataforma para discutir novas descobertas. O evento contou com a participação de importantes players do setor de IA, apresentando suas últimas inovações. Entre eles, a Intel, que participou do evento apresentando um keynote sobre seu novo e inovador AI PC e a integração do Intel OpenVino com os modelos Ultralytics YOLO, como o Ultralytics YOLO11.

A apresentação foi liderada por Adrian Boguszewski, um Software Evangelist que co-escreveu o dataset LandCover.ai e educa os desenvolvedores sobre o kit de ferramentas OpenVINO da Intel, e Dmitriy Pastushenkov, um AI PC Evangelist com mais de 20 anos de experiência em automação industrial e IA. Durante o evento, Adrian compartilhou seu entusiasmo e disse: "Este é um grande evento hoje, não só porque a Ultralytics lançou uma nova versão do YOLO, mas também porque podemos apresentar este novo modelo rodando em nosso novo hardware, bem como uma nova versão do OpenVINO."

Neste artigo, vamos dar uma olhada nos principais destaques da apresentação da Intel no YV24, aprofundando os detalhes de seu AI PC, a série Intel Core Ultra 200V, e como eles se integram com os modelos Ultralytics YOLO usando o kit de ferramentas OpenVINO. Vamos começar!

Tecnologias de IA de ponta em 2024

Dmitriy começou a apresentação abordando as principais diferenças entre a IA tradicional e a IA generativa. O foco girou em torno de como essas tecnologias e seus casos de uso estão evoluindo em 2024. As técnicas tradicionais de IA, como visão computacional e processamento de linguagem natural, têm sido essenciais para tarefas como estimativa de pose, detecção de objetos e reconhecimento de voz. A IA generativa, no entanto, representa uma nova onda de tecnologia de IA que envolve aplicações como chatbots, geração de texto para imagem, escrita de código e até mesmo texto para vídeo

__wf_reserved_inherit
Fig 1. Adrian e Dmitriy da Intel, no palco do YV24, discutindo casos de uso de IA.

Dmitriy apontou a diferença de escala entre os dois. Ele explicou que, enquanto os modelos de IA tradicionais consistem em milhões de parâmetros, os modelos de IA generativa operam em uma escala muito maior. Os modelos de IA generativa geralmente envolvem bilhões ou até trilhões de parâmetros, tornando-os muito mais exigentes computacionalmente.

O Intel AI PC: Uma nova fronteira de hardware de IA

Dmitriy apresentou o Intel AI PC como uma nova solução de hardware projetada para enfrentar os crescentes desafios de executar modelos de IA tradicionais e generativos de forma eficiente. O Intel AI PC é uma máquina poderosa e com baixo consumo de energia. Ele é capaz de executar uma ampla gama de modelos de IA localmente, sem a necessidade de processamento baseado em nuvem. 

O processamento local ajuda a manter os dados confidenciais privados. Quando os modelos de IA podem operar independentemente das conexões com a internet, as preocupações éticas das indústrias em relação à privacidade e segurança são respondidas.

A força motriz por trás do Intel AI PC é o processador Intel Core Ultra série 200V. Este processador incorpora três componentes principais: a Unidade Central de Processamento (CPU), a Unidade de Processamento Gráfico (GPU) e a Unidade de Processamento Neural (NPU). Cada um desempenha um papel específico no tratamento de diferentes tipos de cargas de trabalho de IA. A CPU é ideal para tarefas menores e de baixa latência que exigem respostas rápidas, enquanto a GPU é otimizada para operações de alto rendimento, como a execução de modelos de IA. A NPU, projetada para eficiência energética, é adequada para tarefas de longa duração, como detecção de objetos em tempo real com modelos como o YOLO11

Foi destacado que a CPU pode fornecer até 5 TOPS (Trilhões de Operações por Segundo), a GPU até 67 TOPS, e a NPU fornece uma maneira eficiente em termos de energia para executar tarefas de IA continuamente sem esgotar os recursos do sistema.

Avanços de IA da Intel: Intel Core Ultra série 200V

O processador Intel Core Ultra Série 200V integra os três mecanismos de IA - NPU, CPU e GPU - em um único chip pequeno. Seu design é perfeitamente adequado para dispositivos compactos, como notebooks, sem sacrificar o desempenho.

O processador também inclui RAM integrada, reduzindo a necessidade de placas gráficas separadas. Isso ajuda a diminuir o uso de energia e mantém o dispositivo compacto. Dmitriy também enfatizou a flexibilidade do processador. Os usuários podem decidir se desejam executar modelos de IA na CPU, GPU ou NPU, dependendo da tarefa. Por exemplo, a detecção de objetos com modelos YOLO11 pode ser executada em qualquer um desses mecanismos, enquanto tarefas mais complexas, como a geração de texto para imagem, podem usar a GPU e a NPU ao mesmo tempo para obter melhor desempenho.

Durante a apresentação, Dmitriy tirou o chip do bolso, dando a todos uma noção clara de quão pequeno ele realmente é - apesar de sua capacidade de lidar com tarefas de IA tão avançadas. Foi uma maneira divertida e memorável de mostrar como a Intel está trazendo recursos poderosos de IA para dispositivos mais portáteis e práticos.

__wf_reserved_inherit
Fig 2. O processador Intel Core Ultra 2000V cabe em um bolso.

Otimizando modelos de IA com Intel OpenVino

Depois de apresentar os mais recentes avanços de hardware da Intel, Dmitriy mudou o foco para a pilha de software da Intel que oferece suporte à IA. Ele apresentou o OpenVINO, a estrutura de código aberto da Intel projetada para otimizar e implantar modelos de IA de forma eficiente em diferentes dispositivos. O OpenVINO vai além das tarefas visuais, estendendo seu suporte a modelos de IA usados para processamento de linguagem natural, processamento de áudio, transformers, etc.

O OpenVINO é compatível com plataformas populares como PyTorch, TensorFlow e ONNX, e os desenvolvedores podem incorporá-lo facilmente em seus fluxos de trabalho. Um recurso importante que ele chamou a atenção foi a quantização. A quantização comprime os pesos do modelo para reduzir seu tamanho, de modo que modelos grandes possam ser executados sem problemas em dispositivos locais sem a necessidade da nuvem. O OpenVINO funciona em várias estruturas, executado em CPU, GPU, NPU, FPGA ou até mesmo dispositivos ARM, e oferece suporte a Windows, Linux e macOS. Dmitriy também mostrou ao público como é fácil começar a usar o OpenVINO. 

__wf_reserved_inherit
Fig 3. Dmitriy explicando como começar a usar o OpenVino.

Integrando Ultralytics com Intel OpenVino

Na segunda parte da palestra, o microfone foi passado para Adrian, que explicou a integração perfeita entre os modelos Ultralytics YOLO e o kit de ferramentas OpenVINO da Intel, simplificando o processo de implantação do modelo YOLO. Ele forneceu uma explicação passo a passo de como a exportação de um modelo YOLO usando o pacote Ultralytics Python para o formato OpenVINO é rápida e direta. Essa integração torna muito mais fácil para os desenvolvedores otimizar seus modelos para hardware Intel e obter o máximo de ambas as plataformas.

__wf_reserved_inherit
Fig 4. Adrian explicando como o Ultralytics facilita a exportação do seu modelo para o formato OpenVino.

Adrian demonstrou que, uma vez que um modelo Ultralytics YOLO é treinado, os usuários podem exportá-lo usando alguns sinalizadores de linha de comando simples. Por exemplo, os usuários podem especificar se desejam exportar o modelo como uma versão de ponto flutuante para máxima precisão ou como uma versão quantizada para melhor velocidade e eficiência. Ele também destacou como os desenvolvedores podem gerenciar esse processo diretamente por meio de código, usando opções como a quantização INT8 para melhorar o desempenho sem sacrificar muita precisão. 

Demos de IA em tempo real no Intel AI PC

Colocando toda essa teoria em prática, a equipe da Intel apresentou uma demonstração em tempo real de detecção de objetos executando o YOLO11 no Intel AI PC. Adrian mostrou como o sistema lidava com o modelo em diferentes processadores, atingindo 36 quadros por segundo (FPS) na CPU com um modelo de ponto flutuante, mais de 100 FPS na GPU integrada e 70 FPS com a versão quantizada INT8. Eles conseguiram mostrar o quão eficientemente o Intel AI PC pode gerenciar tarefas complexas de IA.

Ele também apontou que o sistema pode executar modelos em paralelo, usando a CPU, GPU e NPU juntas para tarefas onde todos os dados ou quadros de vídeo estão disponíveis antecipadamente. Isso é útil ao processar cargas pesadas como vídeos. O sistema pode dividir a carga de trabalho entre diferentes processadores, tornando-o mais rápido e eficiente.

Para concluir, Adrian mencionou que os usuários poderiam experimentar demos em casa, incluindo soluções como contagem de pessoas e gerenciamento inteligente de filas. Em seguida, ele mostrou uma demo bônus onde os usuários podiam inserir prompts para gerar imagens oníricas em tempo real na GPU. Demonstrou a versatilidade do Intel AI PC tanto para tarefas tradicionais de IA quanto para projetos criativos e generativos de IA.

Detecção de objetos em tempo real com Intel OpenVINO

No evento, a Intel tinha um estande onde exibiu uma demonstração de detecção de objetos em tempo real usando o YOLO11, executado em seu Intel AI PC. Os participantes puderam ver o modelo em ação, otimizado com OpenVINO e implantado no processador Intel Core Ultra 200V. 

__wf_reserved_inherit
Fig 5. Os participantes tiveram a chance de ver uma demonstração em tempo real no estande da Intel OpenVino.

No estande da Intel, Dmitry compartilhou: "Esta é a minha primeira vez na YOLO Vision e estou feliz por estar em Madrid. Estamos apresentando o modelo YOLO11 da Ultralytics, executado no processador Intel Core Ultra 200V. Ele mostra um excelente desempenho e usamos o OpenVINO para otimizar e implantar o modelo. Foi muito fácil colaborar com a Ultralytics e executar o modelo no hardware Intel mais recente, utilizando a CPU, GPU e NPU." O estande também tinha alguns brindes divertidos, como camisetas e cadernos para os participantes levarem para casa.

Principais conclusões

A palestra técnica da Intel na YV24, apresentando os processadores Intel Core Ultra Série 200V, mostrou como o kit de ferramentas OpenVINO otimiza modelos de IA como o Ultralytics YOLO11. Essa integração permite que os usuários executem modelos YOLO diretamente em seus dispositivos, oferecendo ótimo desempenho para tarefas de visão computacional, como detecção de objetos. O principal benefício é que os usuários não precisam depender de serviços de nuvem.

Desenvolvedores e entusiastas de IA podem executar e ajustar modelos YOLO sem esforço, utilizando totalmente hardware como CPUs, GPUs e NPUs para aplicações em tempo real. O kit de ferramentas Intel OpenVINO, em combinação com os modelos Ultralytics YOLO, abre novas possibilidades para trazer recursos avançados de IA diretamente para dispositivos pessoais, tornando-o uma opção ideal para desenvolvedores ansiosos para impulsionar inovações de IA em vários setores.

Vamos colaborar e inovar! Visite nosso repositório GitHub para explorar nossas contribuições e interagir com nossa comunidade. Veja como estamos usando a IA para causar impacto em setores como manufatura e saúde.

Vamos construir o futuro
da IA juntos!

Comece sua jornada com o futuro do aprendizado de máquina

Comece gratuitamente
Link copiado para a área de transferência