Usando o Ultralytics YOLO11 para executar inferências em lote

15 de maio de 2025
Explore a diferença entre inferência em tempo real e inferência em lote ao usar o Ultralytics YOLO11 para diversas aplicações de visão computacional.

15 de maio de 2025
Explore a diferença entre inferência em tempo real e inferência em lote ao usar o Ultralytics YOLO11 para diversas aplicações de visão computacional.
Se já viu um carro autónomo em ação, testemunhou a inferência de IA em tempo real. Um carro autónomo normalmente usa câmaras, sensores e IA para processar o que o rodeia e tomar decisões quase instantâneas. No entanto, quando não são necessárias respostas rápidas, a inferência em tempo real pode ser pesada em termos de recursos.
Uma opção melhor nesses casos é a inferência em lote. Em vez de processar os dados continuamente em tempo real, uma inferência em lote pode lidar com grandes conjuntos de dados em intervalos agendados. Essa abordagem ajuda a economizar recursos, reduzir o consumo de energia e diminuir os custos de infraestrutura.
Por exemplo, em aplicações de visão computacional, modelos como o Ultralytics YOLO11 podem ser usados para tarefas em tempo real, como detecção de objetos e segmentação de instâncias. No entanto, processar grandes volumes de dados visuais em tempo real pode ser exigente.

Com a inferência em lote, o YOLO11 pode ser executado em dados visuais em lotes, reduzindo a carga sobre o sistema e melhorando a eficiência sem sacrificar o desempenho. Isso facilita a implantação de soluções de Visão de IA em escala, sem sobrecarregar o hardware ou aumentar os custos.
Neste artigo, exploraremos a inferência em lote, seus benefícios e como a inferência em lote usando YOLO11 pode ser aplicada em aplicações de visão computacional. Vamos começar!
Você pode pensar na inferência em lote como abordar uma grande tarefa de uma só vez, em vez de lidar com ela parte por parte à medida que chega. Em vez de processar dados constantemente em tempo real, a inferência em lote permite que você processe grandes grupos de dados em intervalos definidos. Essa abordagem é muito mais eficiente quando respostas imediatas não são necessárias, ajudando a economizar recursos de computação, reduzir o uso de energia e cortar custos.
Quando se trata de visão computacional, existem certas aplicações onde a baixa latência é vital. Baixa latência se refere ao atraso mínimo entre o recebimento da entrada (como uma imagem ou quadro de vídeo) e a resposta do sistema. Por exemplo, no monitoramento de segurança em tempo real, mesmo pequenos atrasos podem resultar em riscos à segurança.
No entanto, em muitos outros cenários de visão computacional, a baixa latência não é tão crítica. É aqui que a inferência em lote se destaca - quando o sistema não precisa reagir instantaneamente. A inferência em lote funciona alimentando dados visuais para um modelo de visão computacional em grupos ou lotes, permitindo que o sistema processe grandes conjuntos de dados de uma só vez, em vez de continuamente em tempo real.
Aqui está uma análise mais detalhada das etapas envolvidas na inferência em lote:
Agora que abordamos o que é inferência em lote e como ela difere da inferência em tempo real, vamos dar uma olhada mais de perto em quando usá-la.
A inferência em lote é ideal para analisar dados históricos. Digamos que você tenha imagens de vigilância de uma estação de metrô do mês passado e esteja tentando identificar padrões específicos, como o número de pessoas que entram e saem em diferentes horários do dia.
Em vez de processar cada frame em tempo real, a inferência em lote permite que você processe o valor de um mês inteiro de filmagens em lotes, identificando eventos ou tendências importantes sem a necessidade de resultados imediatos. Desta forma, você pode analisar grandes volumes de dados de forma mais eficiente e obter insights sobre padrões de longo prazo, sem sobrecarregar o sistema ou exigir monitoramento constante.
A inferência em lote também é uma solução ideal quando os recursos do sistema são limitados. Ao executar a inferência durante horários de menor movimento (como durante a noite), você pode economizar em custos de computação e garantir que o sistema não fique sobrecarregado durante os horários de pico. Isso o torna uma abordagem eficiente e econômica para empresas ou projetos que precisam processar grandes conjuntos de dados, mas não exigem análise em tempo real.
O pacote Ultralytics Python oferece suporte à inferência em lote para modelos como o YOLO11. Com o YOLO11, você pode executar facilmente a inferência em lote especificando o argumento 'batch', que determina quantas imagens ou quadros de vídeo são processados de uma vez.
Durante o processo de inferência em lote, as previsões são geradas para todas as imagens no lote simultaneamente. Por padrão, o tamanho do lote é definido como 1, mas você pode ajustá-lo para qualquer número que preferir.
Por exemplo, se o tamanho do lote for definido como 5, o YOLO11 processará cinco imagens ou quadros de vídeo por vez e gerará previsões para todos os cinco de uma só vez. Tamanhos de lote maiores normalmente levam a tempos de inferência mais rápidos, pois processar várias imagens em um lote é mais eficiente do que lidar com elas individualmente.
Em seguida, vamos explorar alguns casos de uso de visão computacional no mundo real para inferência em lote.
Em pesquisa médica, trabalhar com grandes quantidades de dados visuais é muito comum. Aqui, a inferência em lote pode ajudar os cientistas a analisar os dados mais facilmente em áreas como química, biologia e genética. Em vez de analisar um de cada vez, os dados são processados em lotes, economizando tempo e esforço.
Por exemplo, em instalações médicas, a inferência em lote pode ser especialmente útil para analisar grandes conjuntos de imagens médicas, como ressonâncias magnéticas ou tomografias computadorizadas. Os hospitais podem coletar essas digitalizações ao longo do dia e processá-las em lotes durante a noite.
Esta abordagem permite que os hospitais façam um melhor uso de seu hardware e equipe, reduzam os custos operacionais e garantam que todas as varreduras sejam revisadas de forma consistente e uniforme. Também é benéfico para grandes projetos de pesquisa e estudos de longo prazo, onde o manuseio de grandes quantidades de dados é necessário.

Os carros autônomos usam tecnologias de IA como visão computacional para processar o mundo ao seu redor. Com a ajuda de modelos avançados como o YOLO11, os sistemas integrados no carro podem reconhecer outros veículos, faixas de rodagem, placas de trânsito e pessoas na rua. Embora a inferência em tempo real seja crítica na estrada, a tecnologia de direção autônoma também depende fortemente da inferência em lote nos bastidores.

Após a conclusão de uma viagem por um carro, os dados coletados, como horas de filmagens de câmeras, leituras de sensores e scans LIDAR, podem ser processados posteriormente em grandes lotes. Isso possibilita que os engenheiros atualizem os modelos de IA do carro, aprimorem a segurança do sistema e melhorem sua capacidade de lidar com diversas condições de direção.
A inferência em lote também é usada em simulações de direção autônoma para testar como os carros autônomos reagiriam em diferentes situações, como navegar em cruzamentos movimentados ou responder a movimentos imprevisíveis de pedestres. Essa abordagem economiza tempo, reduz custos e evita os riscos associados a testes de cada cenário na vida real.
Da mesma forma, para lojas de varejo, a inferência em lote com modelos de visão computacional como o YOLO11 pode aumentar significativamente a eficiência operacional. Por exemplo, os sistemas de câmeras nas lojas podem capturar milhares de imagens ao longo do dia, que podem ser processadas em lotes durante a noite.
Isso permite que as lojas analisem o que está acontecendo na loja, como o comportamento do cliente, os padrões de tráfego e as interações com o produto, sem a necessidade de processamento em tempo real, o que pode ser um desafio para lojas menores.
Outro exemplo interessante é o uso da inferência em lote para gerar mapas de calor, que visualizam áreas de alta e baixa atividade do cliente dentro da loja. Ao analisar esses mapas de calor, os varejistas podem identificar quais áreas atraem mais tráfego de pedestres e quais partes da loja podem precisar de mais atenção ou otimização de posicionamento de produtos. Esses dados podem ajudar os varejistas a tomar melhores decisões sobre o layout da loja, o posicionamento dos produtos e até mesmo as estratégias promocionais para melhorar a experiência do cliente e as vendas.

Aqui estão alguns dos principais benefícios que a inferência em lote pode trazer para vários setores:
Embora existam muitas vantagens em usar a inferência em lote, também existem algumas limitações a serem consideradas. Aqui estão alguns fatores a serem lembrados:
A inferência em lote é uma maneira eficiente de processar grandes volumes de dados visuais que não exigem resultados imediatos. Em vez de analisar cada imagem em tempo real, ela as processa em lotes em horários programados, como durante a noite.
Este método é econômico, reduz a carga computacional e ainda fornece resultados precisos. Desde ajudar as lojas a gerenciar o estoque até auxiliar os médicos na análise de exames médicos e aprimorar as tecnologias de carros autônomos, a inferência em lote torna a visão computacional mais acessível, acessível e prática para aplicações no mundo real.
Pronto para mergulhar fundo na IA? Explore nosso repositório GitHub, conecte-se com nossa comunidade e confira nossas opções de licenciamento para começar sua jornada na visão computacional. Saiba mais sobre inovações como IA na manufatura e visão computacional na indústria de logística em nossas páginas de soluções.