Ao clicar em "Aceitar todos os cookies", concorda com o armazenamento de cookies no seu dispositivo para melhorar a navegação no site, analisar a utilização do site e ajudar nos nossos esforços de marketing. Mais informações
Definições de cookies
Ao clicar em "Aceitar todos os cookies", concorda com o armazenamento de cookies no seu dispositivo para melhorar a navegação no site, analisar a utilização do site e ajudar nos nossos esforços de marketing. Mais informações
Revisitar a palestra YOLO Vision 2024 de Dmitriy Pastushenkov e Adrian Boguszewski sobre a otimização dos modelos YOLO com o Intel OpenVino e a execução de inferências em tempo real no AI PC da Intel.
O YOLO Vision 2024 (YV24), o evento híbrido anual da Ultralytics, reuniu entusiastas da IA, programadores e especialistas de todo o mundo para explorar as mais recentes inovações no domínio da visão computacional. O YV24 foi uma excelente oportunidade e plataforma para discutir novos avanços. O evento contou com a participação dos principais intervenientes no sector da IA, que apresentaram as suas últimas inovações. Entre eles estava a Intel, que participou no evento apresentando uma palestra sobre o seu novo e inovador PC de IA e a integração do Intel OpenVino com os modelos Ultralytics YOLO, como o Ultralytics YOLO11.
A palestra foi conduzida por Adrian Boguszewski, um evangelista de software que foi coautor do conjunto de dados LandCover.ai e educa os desenvolvedores sobre o kit de ferramentas OpenVINO da Intel, e Dmitriy Pastushenkov, um evangelista de PC de IA com mais de 20 anos de experiência em automação industrial e IA. Durante o evento, Adrian partilhou o seu entusiasmo e disse: "Este é um grande evento hoje, não só porque a Ultralytics entregou uma nova versão do YOLO, mas também porque podemos apresentar este novo modelo a funcionar no nosso novo hardware, bem como uma nova versão do OpenVINO."
Neste artigo, analisaremos os principais destaques da palestra da Intel no YV24, aprofundando os detalhes de seu PC de IA, a série Intel Core Ultra 200V, e como eles se integram aos modelos Ultralytics YOLO usando o kit de ferramentas OpenVINO. Vamos começar!
Fig. 1. Adrian e Dmitriy da Intel, no palco do YV24, a discutir casos de utilização de IA.
Dmitriy chamou a atenção para a diferença de escala entre os dois. Explicou que, enquanto os modelos tradicionais de IA consistem em milhões de parâmetros, os modelos de IA generativa funcionam numa escala muito maior. Os modelos de IA generativa envolvem frequentemente milhares de milhões ou mesmo biliões de parâmetros, o que os torna muito mais exigentes do ponto de vista computacional.
O Intel AI PC: Uma nova fronteira de hardware de IA
Dmitriy apresentou o Intel AI PC como uma nova solução de hardware concebida para enfrentar os desafios crescentes de executar modelos de IA tradicionais e generativos de forma eficiente. O Intel AI PC é uma máquina potente e eficiente em termos energéticos. É capaz de executar uma vasta gama de modelos de IA localmente, sem necessidade de processamento baseado na nuvem.
O processamento local ajuda a manter a privacidade dos dados sensíveis. Quando os modelos de IA podem funcionar independentemente das ligações à Internet, as preocupações éticas das indústrias relativamente à privacidade e à segurança são respondidas.
A força motriz por detrás do Intel AI PC é o processador Intel Core Ultra Série 200V. Este processador incorpora três componentes principais: a Unidade Central de Processamento (CPU), a Unidade de Processamento Gráfico (GPU) e a Unidade de Processamento Neural (NPU). Cada um desempenha um papel específico no tratamento de diferentes tipos de cargas de trabalho de IA. A CPU é ideal para tarefas menores e de baixa latência que exigem respostas rápidas, enquanto a GPU é otimizada para operações de alto rendimento, como a execução de modelos de IA. A NPU, concebida para eficiência energética, é adequada para tarefas de longa duração, como a deteção de objectos em tempo real com modelos como o YOLO11.
Foi salientado que a CPU pode fornecer até 5 TOPS (triliões de operações por segundo), a GPU até 67 TOPS e a NPU fornece uma forma eficiente em termos energéticos para executar tarefas de IA continuamente sem esgotar os recursos do sistema.
Os avanços da Intel em matéria de IA: Série Intel Core Ultra 200V
O processador Intel Core Ultra Série 200V integra os três motores de IA - NPU, CPU e GPU - num único chip pequeno. O seu design é perfeitamente adequado para dispositivos compactos, como computadores portáteis, sem sacrificar o desempenho.
O processador também inclui RAM incorporada, eliminando a necessidade de placas gráficas separadas. Isto ajuda a reduzir o consumo de energia e mantém o dispositivo compacto. Dmitriy também enfatizou a flexibilidade do processador. Os utilizadores podem decidir se querem executar modelos de IA na CPU, GPU ou NPU, dependendo da tarefa. Por exemplo, a deteção de objectos com modelos YOLO11 pode ser executada em qualquer um destes motores, enquanto tarefas mais complexas, como a geração de texto para imagem, podem utilizar a GPU e a NPU em simultâneo para um melhor desempenho.
Durante a apresentação, Dmitriy tirou o chip do bolso, dando a todos uma noção clara do quão pequeno ele realmente é - apesar da sua capacidade de lidar com tarefas de IA tão avançadas. Foi uma forma divertida e memorável de mostrar como a Intel está a trazer poderosas capacidades de IA para dispositivos mais portáteis e práticos.
Figura 2. O processador Intel Core Ultra 2000V cabe num bolso.
Otimização de modelos de IA com o Intel OpenVino
Depois de apresentar os mais recentes avanços de hardware da Intel, Dmitriy mudou de marcha para a pilha de software da Intel que suporta IA. Apresentou o OpenVINO, a estrutura de código aberto da Intel concebida para otimizar e implementar modelos de IA de forma eficiente em diferentes dispositivos. O OpenVINO vai para além das tarefas visuais, alargando o seu suporte a modelos de IA utilizados para processamento de linguagem natural, processamento de áudio, transformadores, etc.
O OpenVINO é compatível com plataformas populares como PyTorch, TensorFlow e ONNX, e os programadores podem incorporá-lo facilmente nos seus fluxos de trabalho. Um recurso importante para o qual ele chamou a atenção foi a quantização. A quantização comprime os pesos do modelo para reduzir seu tamanho, de modo que modelos grandes possam ser executados sem problemas em dispositivos locais sem precisar da nuvem. O OpenVINO funciona em vários frameworks, rodando em dispositivos CPU, GPU, NPU, FPGA ou mesmo ARM, e suporta Windows, Linux e macOS. Dmitriy também mostrou ao público como é fácil começar a usar o OpenVINO.
Fig. 3. Dmitriy explica como começar a utilizar o OpenVino.
Integração do Ultralytics com o Intel OpenVino
Na segunda parte da palestra, o microfone foi passado para Adrian, que explicou a integração perfeita entre os modelos Ultralytics YOLO e o kit de ferramentas OpenVINO da Intel, simplificando o processo de implantação do modelo YOLO. Ele explicou passo a passo como a exportação de um modelo YOLO usando o pacote Ultralytics Python para o formato OpenVINO é rápida e direta. Esta integração torna muito mais fácil para os programadores optimizarem os seus modelos para hardware Intel e tirarem o máximo partido de ambas as plataformas.
Fig. 4. Adrian explica como o Ultralytics facilita a exportação do seu modelo para o formato OpenVino.
Adrian demonstrou que, depois de um modelo Ultralytics YOLO ser treinado, os utilizadores podem exportá-lo utilizando alguns sinalizadores de linha de comando simples. Por exemplo, os utilizadores podem especificar se pretendem exportar o modelo como uma versão de vírgula flutuante para uma precisão máxima ou como uma versão quantizada para uma maior velocidade e eficiência. Também destacou a forma como os programadores podem gerir este processo diretamente através do código, utilizando opções como a quantização INT8 para melhorar o desempenho sem sacrificar demasiado a precisão.
Demonstrações de IA em tempo real no Intel AI PC
Colocando toda esta teoria em prática, a equipa da Intel apresentou uma demonstração em tempo real da deteção de objectos, executando o YOLO11 no Intel AI PC. Adrian mostrou como o sistema lidou com o modelo em diferentes processadores, alcançando 36 quadros por segundo (FPS) na CPU com um modelo de ponto flutuante, mais de 100 FPS na GPU integrada e 70 FPS com a versão quantizada INT8. Eles conseguiram mostrar a eficiência com que o Intel AI PC pode gerenciar tarefas complexas de IA.
Também salientou que o sistema pode executar modelos em paralelo, utilizando a CPU, a GPU e a NPU em conjunto para tarefas em que todos os dados ou fotogramas de vídeo estão disponíveis antecipadamente. Isso é útil ao processar cargas pesadas, como vídeos. O sistema pode dividir a carga de trabalho entre diferentes processadores, tornando-a mais rápida e eficiente.
Para terminar, Adrian referiu que os utilizadores podiam experimentar as demonstrações em casa, incluindo soluções como a contagem de pessoas e a gestão inteligente de filas de espera. Em seguida, apresentou uma demonstração de bónus em que os utilizadores podiam introduzir instruções para gerar imagens de sonho em tempo real na GPU. Demonstrou a versatilidade do Intel AI PC tanto para tarefas tradicionais de IA como para projectos criativos e generativos de IA.
Deteção de objectos em tempo real com o Intel OpenVINO
No evento, a Intel teve um stand onde apresentou uma demonstração de deteção de objectos em tempo real utilizando o YOLO11, executado no seu Intel AI PC. Os participantes puderam ver o modelo em ação, optimizado com o OpenVINO, e implementado no processador Intel Core Ultra 200V.
Fig. 5. Os participantes tiveram a oportunidade de ver uma demonstração em tempo real no stand da Intel OpenVino.
No stand da Intel, Dmitry partilhou: "É a minha primeira vez na YOLO Vision e estou contente por estar em Madrid. Estamos a apresentar o modelo YOLO11 da Ultralytics, executado no processador Intel Core Ultra 200V. Apresenta um excelente desempenho e utilizamos o OpenVINO para otimizar e implementar o modelo. Foi muito fácil colaborar com a Ultralytics e executar o modelo no mais recente hardware da Intel, utilizando a CPU, a GPU e a NPU." O stand também tinha alguns brindes divertidos, como t-shirts e computadores portáteis para os participantes levarem para casa.
Principais conclusões
A palestra técnica da Intel no YV24, com os processadores Intel Core Ultra Série 200V, mostrou como o kit de ferramentas OpenVINO optimiza modelos de IA como o Ultralytics YOLO11. Esta integração permite aos utilizadores executar modelos YOLO diretamente nos seus dispositivos, proporcionando um excelente desempenho para tarefas de visão por computador, como a deteção de objectos. A principal vantagem é que os utilizadores não precisam de depender de serviços na nuvem.
Os programadores e os entusiastas da IA podem executar e afinar facilmente os modelos YOLO, utilizando totalmente o hardware como CPUs, GPUs e NPUs para aplicações em tempo real. O kit de ferramentas Intel OpenVINO, em combinação com os modelos Ultralytics YOLO, abre novas possibilidades para trazer capacidades avançadas de IA diretamente para os dispositivos pessoais, tornando-o uma opção ideal para os programadores ansiosos por impulsionar inovações de IA em vários sectores.
Vamos colaborar e inovar! Visite o nosso repositório GitHub para explorar as nossas contribuições e interagir com a nossa comunidade. Veja como estamos a utilizar a IA para causar impacto em sectores como o fabrico e os cuidados de saúde.