Usando Ultralytics YOLO11 para executar inferências em lote
Explore a diferença entre inferência em tempo real e inferência em lote ao usar o Ultralytics YOLO11 para várias aplicações de visão computacional.

Se você já viu um carro autônomo em ação, presenciou uma inferência de IA em tempo real. Um carro autônomo normalmente usa câmeras, sensores e IA para processar o que está ao seu redor e tomar decisões quase instantâneas. No entanto, quando respostas rápidas não são necessárias, a inferência em tempo real pode exigir muitos recursos.
Uma opção melhor nesses casos é a inferência em lote. Em vez de processar dados continuamente em tempo real, a inferência em lote pode lidar com grandes conjuntos de dados em intervalos programados. Essa abordagem ajuda a economizar recursos, reduzir o consumo de energia e diminuir os custos de infraestrutura.
Por exemplo, em aplicações de visão computacional, modelos como o Ultralytics YOLO11 podem ser usados para tarefas em tempo real, como detecção de objetos e segmentação de instâncias. Contudo, processar grandes volumes de dados visuais em tempo real pode ser exigente.

Fig 1. Um exemplo de segmentação de objetos em uma imagem usando o YOLO11.
Com a inferência em lote, o YOLO11 pode ser executado em dados visuais em lotes, reduzindo a carga no sistema e melhorando a eficiência sem sacrificar o desempenho. Isso facilita a implementação de soluções de Vision AI em escala, sem sobrecarregar o hardware ou aumentar os custos.
Neste artigo, exploraremos a inferência em lote, seus benefícios e como a inferência em lote usando o YOLO11 pode ser aplicada em aplicações de visão computacional. Vamos começar!
Link to this sectionUma visão sobre a inferência em lote na visão computacional#
Você pode pensar na inferência em lote como lidar com uma grande tarefa de uma só vez, em vez de tratá-la peça por peça conforme ela chega. Em vez de processar constantemente dados em tempo real, a inferência em lote permite processar grandes grupos de dados em intervalos definidos. Essa abordagem é muito mais eficiente quando respostas imediatas não são necessárias, ajudando a economizar recursos computacionais, reduzir o uso de energia e cortar custos.
Quando se trata de visão computacional, existem certas aplicações onde a baixa latência é vital. Baixa latência refere-se ao atraso mínimo entre o recebimento de uma entrada (como uma imagem ou um quadro de vídeo) e a resposta do sistema. Por exemplo, no monitoramento de segurança em tempo real, até pequenos atrasos podem resultar em riscos à segurança.
No entanto, em muitos outros cenários de visão computacional, a baixa latência não é tão crítica. É aqui que a inferência em lote brilha - quando o sistema não precisa reagir instantaneamente. A inferência em lote funciona enviando dados visuais para um modelo de visão computacional em grupos ou lotes, permitindo que o sistema processe grandes conjuntos de dados de uma vez em vez de continuamente em tempo real.
Link to this sectionEntendendo como a inferência em lote funciona#
Aqui está uma visão mais detalhada das etapas envolvidas na inferência em lote:
-
Coleta de dados: Dados visuais são coletados durante um período de tempo. Isso pode incluir filmagens de segurança, imagens de produtos ou dados de clientes, dependendo da aplicação.
-
Preparação de lote: Os dados coletados são então agrupados em lotes. Durante esta etapa, os dados são formatados conforme necessário pelo modelo. Por exemplo, imagens podem ser redimensionadas, normalizadas ou convertidas para o formato apropriado para o modelo processar.
-
Previsão: Uma vez que os dados estão preparados, o lote inteiro é enviado para o modelo (como o YOLO11), que processa todo o lote de uma vez. Isso permite que o modelo faça previsões para todos os dados no lote simultaneamente, tornando o processo mais eficiente em comparação com o tratamento de cada ponto de dados individualmente.
Link to this sectionQuando usar a inferência em lote?#
Agora que abordamos o que é a inferência em lote e como ela difere da inferência em tempo real, vamos analisar mais detalhadamente quando usá-la.
A inferência em lote é ideal para analisar dados históricos. Digamos que você tenha imagens de vigilância de uma estação de metrô ao longo do último mês e esteja tentando identificar padrões específicos, como o número de pessoas entrando e saindo em diferentes horários do dia.
Em vez de processar cada quadro em tempo real, a inferência em lote permite processar todo o material de um mês em lotes, identificando eventos ou tendências principais sem a necessidade de resultados imediatos. Dessa forma, você pode analisar grandes volumes de dados de forma mais eficiente e obter insights sobre padrões de longo prazo, sem sobrecarregar o sistema ou exigir monitoramento constante.
A inferência em lote também é uma solução ideal quando os recursos do sistema são limitados. Ao executar a inferência fora dos horários de pico (como durante a noite), você pode economizar em custos de computação e garantir que o sistema não fique sobrecarregado durante horários de pico de uso. Isso a torna uma abordagem eficiente e econômica para empresas ou projetos que precisam processar grandes conjuntos de dados, mas não exigem análise em tempo real.
Link to this sectionInferência em lote usando o Ultralytics YOLO11#
O pacote Python da Ultralytics suporta inferência em lote para modelos como o YOLO11. Com o YOLO11, você pode executar facilmente a inferência em lote especificando o argumento 'batch', que determina quantas imagens ou quadros de vídeo são processados de uma vez.
Durante o processo de inferência em lote, previsões são geradas para todas as imagens do lote simultaneamente. Por padrão, o tamanho do lote é definido como 1, mas você pode ajustá-lo para qualquer número que preferir.
Por exemplo, se o tamanho do lote for definido como 5, o YOLO11 processará cinco imagens ou quadros de vídeo por vez e gerará previsões para todos os cinco de uma só vez. Tamanhos de lote maiores geralmente levam a tempos de inferência mais rápidos, pois processar múltiplas imagens em um lote é mais eficiente do que tratá-las individualmente.
Link to this sectionAplicações de visão computacional habilitadas pela inferência em lote#
A seguir, vamos explorar alguns casos de uso reais de visão computacional para inferência em lote.
Link to this sectionMelhorando diagnósticos e pesquisas na área da saúde#
Na pesquisa médica, trabalhar com grandes quantidades de dados visuais é muito comum. Aqui, a inferência em lote pode ajudar cientistas a analisar dados mais facilmente em campos como química, biologia e genética. Em vez de analisar um de cada vez, os dados são processados em lotes, economizando tempo e esforço.
Por exemplo, em instalações médicas, a inferência em lote pode ser especialmente útil para analisar grandes conjuntos de imagens médicas como ressonâncias magnéticas ou tomografias computadorizadas. Hospitais podem coletar esses exames ao longo do dia e processá-los em lotes durante a noite.
Essa abordagem permite que hospitais façam melhor uso de seu hardware e equipe, reduzam custos operacionais e garantam que todos os exames sejam revisados de maneira consistente e uniforme. Também é benéfico para grandes projetos de pesquisa e estudos de longo prazo, onde é necessário lidar com vastas quantidades de dados.

Fig 2. Detectando um exame médico usando o YOLO11.
Link to this sectionMelhorando veículos autônomos usando simulações#
Carros autônomos usam tecnologias de IA como visão computacional para processar o mundo ao seu redor. Com a ajuda de modelos avançados como o YOLO11, os sistemas de bordo do carro podem reconhecer outros veículos, faixas de rodagem, placas de trânsito e pessoas na rua. Embora a inferência em tempo real seja crítica na estrada, a tecnologia de direção autônoma também depende fortemente da inferência em lote nos bastidores.

Fig 3. O YOLO11 consegue detectar facilmente pedestres na estrada.
Após um carro completar uma viagem, os dados coletados, como horas de filmagens de câmeras, leituras de sensores e varreduras LIDAR, podem ser processados posteriormente em grandes lotes. Isso torna possível para os engenheiros atualizar os modelos de IA do carro, aprimorar a segurança do sistema e melhorar sua capacidade de lidar com várias condições de direção.
A inferência em lote também é usada em simulações de direção autônoma para testar como os carros autônomos reagiriam em diferentes situações, como navegar por cruzamentos movimentados ou responder a movimentos imprevisíveis de pedestres. Essa abordagem economiza tempo, reduz custos e evita os riscos associados ao teste de cada cenário na vida real.
Link to this sectionAnálise de dados de varejo impulsionada pela inferência em lote#
Da mesma forma, para lojas de varejo, a inferência em lote com modelos de visão computacional como o YOLO11 pode aumentar significativamente a eficiência operacional. Por exemplo, sistemas de câmeras em lojas podem capturar milhares de imagens ao longo do dia, que podem então ser processadas em lotes durante a noite.
Isso permite que as lojas analisem o que está acontecendo no estabelecimento, como o comportamento do cliente, padrões de tráfego e interações com produtos, sem a necessidade de processamento em tempo real, o que pode ser desafiador para lojas menores.
Outro exemplo interessante é usar a inferência em lote para gerar mapas de calor, que visualizam áreas de alta e baixa atividade dos clientes dentro da loja. Ao analisar esses mapas de calor, os varejistas podem identificar quais áreas atraem mais tráfego e quais partes da loja podem precisar de mais atenção ou otimização de posicionamento de produtos. Esses dados podem ajudar os varejistas a tomar decisões melhores sobre o layout da loja, posicionamento de produtos e até estratégias promocionais para melhorar a experiência do cliente e as vendas.

Fig 4. Mapas de calor podem ajudar varejistas a identificar áreas populares nas lojas.
Link to this sectionPrós e contras da inferência em lote#
Aqui estão alguns dos principais benefícios que a inferência em lote pode trazer para vários setores:
- Facilidade de integração: A inferência em lote pode ser facilmente integrada aos fluxos de trabalho existentes, particularmente para setores como varejo, segurança ou saúde, onde grandes volumes de dados precisam ser processados em massa.
- Gerenciamento de dados mais fácil: Ao trabalhar com grandes quantidades de dados, a inferência em lote pode simplificar o gerenciamento de dados, uma vez que as informações são agrupadas em pedaços gerenciáveis. Isso torna mais fácil rastrear, revisar e organizar os dados ao longo do tempo.
- Carga de rede reduzida: Quando os dados são processados em lotes, a quantidade de dados transferidos a qualquer momento pode ser minimizada, reduzindo a carga nos recursos de rede em sistemas baseados em nuvem ou ambientes de computação distribuída.
Embora existam muitas vantagens em usar a inferência em lote, há também algumas limitações a serem consideradas. Aqui estão alguns fatores para manter em mente:
- Requisitos de armazenamento: Armazenar grandes conjuntos de dados para processamento em lote pode aumentar significativamente os custos de armazenamento, particularmente com imagens de alta resolução, vídeos ou grandes volumes de dados.
- Potencial de acúmulo: Se os dados se acumulam rapidamente ou se lotes grandes não são processados a tempo, um acúmulo pode se desenvolver. Isso pode levar a atrasos na entrega de insights e no processamento de novos dados de forma oportuna.
- Picos de recursos: Lotes grandes, especialmente aqueles que envolvem imagens de alta resolução, podem causar picos no uso de memória ou computação. Se não forem gerenciados adequadamente, esses picos podem sobrecarregar os sistemas, levando a lentidões ou travamentos.
Link to this sectionPrincipais pontos#
A inferência em lote é uma maneira eficiente de processar grandes volumes de dados visuais que não exigem resultados imediatos. Em vez de analisar cada imagem em tempo real, ela as processa em lotes em horários agendados, como durante a noite.
Este método é econômico, reduz a carga computacional e ainda fornece resultados precisos. Desde ajudar lojas a gerenciar estoques até auxiliar médicos na análise de exames e aprimorar tecnologias de carros autônomos, a inferência em lote torna a visão computacional mais acessível, acessível em custo e prática para aplicações do mundo real.
Pronto para mergulhar fundo na IA? Explore nosso repositório no GitHub, conecte-se com nossa comunidade e confira nossas opções de licenciamento para começar sua jornada na visão computacional. Saiba mais sobre inovações como IA na fabricação e visão computacional na logística em nossas páginas de soluções.






