Yolo Vision Shenzhen
Shenzhen
Junte-se agora

Como calcular a distância usando modelos de visão computacional?

Abirami Vina

4 min de leitura

3 de abril de 2025

Aprenda como o cálculo de distância em aplicações de visão computacional usando o Ultralytics YOLO11 ajuda a medir a proximidade de objetos em tempo real.

Quando você está atravessando a rua e vê um carro vindo em sua direção, você pode dizer instantaneamente a que distância aproximada ele está. Esse julgamento rápido, quase instintivo, é graças a uma compreensão espacial do seu entorno. Com base nesse sentido, você pode decidir se acelera, para ou continua andando. 

Da mesma forma, a visão computacional é um ramo da inteligência artificial (IA) que possibilita que as máquinas desenvolvam uma compreensão de seus arredores, interpretando dados visuais. Assim como você pode avaliar a proximidade de um carro para tomar decisões rápidas, os modelos de visão computacional podem analisar imagens e vídeos, ajudando as máquinas a sentir e reagir ao mundo ao seu redor.

Por exemplo, o Ultralytics YOLO11 é um modelo de visão computacional que pode detectar e rastrear objetos em imagens e vídeos em tempo real. Simplificando, o YOLO11 funciona analisando a imagem inteira de uma vez, em vez de em partes, o que o torna mais rápido e eficiente. Ele também pode lidar com tarefas de visão computacional, como segmentação de instâncias, estimativa de pose e classificação de imagens.

Em particular, os recursos do YOLO11 podem ser usados para calcular a distância entre objetos, o que é útil em muitas áreas, como manufatura, varejo e gerenciamento de multidões, ajudando a melhorar a segurança e a eficiência.

Neste artigo, exploraremos como o YOLO11 pode ser usado para cálculo de distância em aplicações de visão computacional, por que isso é importante e seu impacto em diferentes setores.

__wf_reserved_inherit
Fig 1. Um exemplo de uso do YOLO para calcular a distância de aterrissagem de um avião.

Uma visão geral do cálculo de distância em visão computacional

O cálculo de distância em visão computacional envolve detectar, localizar e medir os pixels entre dois objetos em uma imagem. Pixels são as unidades individuais que compõem uma imagem digital, cada um representando um único ponto com uma cor ou valor de intensidade específico. 

Para converter medidas de pixels em distâncias do mundo real, a calibração é fundamental. Você pode pensar nisso como usar uma régua para medir algo e, em seguida, usar essa medida para entender o tamanho de outros objetos. Ao referenciar objetos com tamanhos conhecidos, a calibração cria uma ligação entre os pixels e as distâncias físicas reais.

Vejamos um exemplo para ver como isso funciona. Na imagem abaixo, a moeda é o objeto de referência, e seu tamanho (0,9 pol. por 1,0 pol.) é conhecido. Ao comparar as medidas de pixels dos outros objetos com o tamanho da moeda, podemos calcular seu tamanho no mundo real.

__wf_reserved_inherit
Fig 2. Uma moeda pode ser usada como referência para medir o tamanho real de outros objetos.

No entanto, o cálculo de distância é feito em um plano bidimensional (2D), o que significa que ele mede apenas as distâncias horizontal e vertical entre os objetos. Isso é diferente da estimativa de profundidade, que mede a distância dos objetos no espaço tridimensional, incluindo sua distância da câmera.

Embora as câmeras de profundidade possam medir a profundidade real e fornecer informações espaciais mais detalhadas, em muitos casos, uma distância calibrada simples é suficiente. Por exemplo, saber a distância entre objetos em um plano 2D funciona bem para tarefas como rastrear objetos ou gerenciar filas, portanto, a estimativa de profundidade não é necessária nessas situações.

Entendendo como funciona o cálculo de distância usando o YOLO11

Em seguida, vamos explicar como calcular a distância entre dois objetos usando o suporte do YOLO11 para detecção de objetos e rastreamento. Aqui está uma análise:

  • Detecção e rastreamento de objetos: O YOLO11 pode ser usado para detectar objetos, reconhecendo-os em um frame e rastreando seu movimento através de frames em um vídeo. Ele atribui um ID de rastreamento exclusivo a cada objeto, permitindo que o sistema monitore sua posição e movimento ao longo do vídeo.
  • Bounding boxes: Bounding boxes são desenhadas ao redor dos objetos detectados com base nos resultados da detecção de objetos do YOLO11, que definem sua localização na imagem.
  • Seleção de objetos: Dois objetos podem ser selecionados para focar, e o YOLO11 atualiza as bounding boxes conforme os objetos se movem em tempo real.
  • Cálculo do centroide: Os centroides (os pontos centrais das bounding boxes dos dois objetos) são calculados com base nas coordenadas dos cantos da bounding box, representando as posições dos objetos.
  • Cálculo de distância: Os centroides dos dois objetos podem então ser usados para calcular a distância euclidiana entre eles. A distância euclidiana é a distância em linha reta entre dois pontos em um plano 2D, calculada usando as diferenças nas direções horizontal e vertical. Isso fornece a distância entre os dois objetos em pixels.

É importante ter em mente que as distâncias calculadas usando este método são apenas estimativas, pois são baseadas em medidas de pixels 2D.

__wf_reserved_inherit
Fig 3. Usando o Ultralytics YOLO para detectar uma pessoa e calcular distâncias. 

O impacto da estimativa de distância do YOLO

Considerando que o cálculo de distâncias usando o YOLO11 é uma estimativa, você pode estar se perguntando: onde isso pode ser usado e como pode fazer a diferença? 

Como as calibrações são usadas para chegar a essas estimativas de distância, elas são precisas o suficiente para ajudar em muitas situações práticas. A estimativa de distância do YOLO11 é particularmente útil em ambientes dinâmicos, como armazéns, onde os objetos estão constantemente em movimento e ajustes em tempo real são necessários para manter as coisas funcionando sem problemas.

Um exemplo interessante é usar o YOLO11 para rastrear pacotes em uma esteira transportadora e estimar a distância entre eles em tempo real. Isso ajuda os gerentes de armazém a garantir que os pacotes estejam espaçados corretamente, evitando colisões e mantendo as coisas funcionando sem problemas. 

Em tais casos, uma distância exata nem sempre é necessária. Normalmente, um intervalo ou limite para a distância ideal é definido, então uma estimativa funciona bem para esses tipos de aplicações.

__wf_reserved_inherit
Fig 4. Detecção de embalagens usando YOLO11 e cálculo da distância entre elas.

Cálculo de Distância em Aplicações de Visão Computacional

Várias aplicações de visão computacional podem se beneficiar do cálculo da distância entre objetos usando YOLO11. Na análise de varejo, por exemplo, ajuda a melhorar o gerenciamento de filas rastreando as posições dos clientes em tempo real. Isso possibilita que as empresas aloquem melhor os recursos, reduzam os tempos de espera e criem uma experiência de compra mais tranquila. Ao ajustar dinamicamente os níveis de pessoal e gerenciar o fluxo de clientes, as lojas podem evitar a superlotação e otimizar o uso do espaço.

Da mesma forma, no gerenciamento de tráfego, a estimativa de distância ajuda a monitorar o espaçamento entre veículos e analisar os padrões de tráfego. Isso pode ser usado para detectar comportamentos perigosos, como direção muito próxima, e ajustar os sinais de trânsito para manter o tráfego fluindo sem problemas. Pode ajudar a tornar as estradas mais seguras, identificando problemas potenciais e melhorando o gerenciamento geral do tráfego em tempo real.

__wf_reserved_inherit
Fig 5. O cálculo de distância habilitado por visão pode ser usado para monitorar o tráfego.

Outro uso exclusivo dessa tecnologia surgiu durante a pandemia de COVID-19, quando ajudou a promover o distanciamento social. Garantiu que as pessoas mantivessem uma distância segura em espaços públicos, lojas e hospitais, reduzindo o risco de propagação do vírus. 

Ao rastrear distâncias em tempo real, alertas podiam ser enviados quando os indivíduos estavam muito próximos, facilitando a resposta rápida de empresas e profissionais de saúde e mantendo um ambiente mais seguro para todos.

Prós e contras do cálculo de distância em visão computacional

Agora que discutimos algumas das aplicações do cálculo de distância usando visão computacional, aqui está uma análise mais detalhada dos benefícios associados:

  • Automação: A IA de visão pode automatizar tarefas de cálculo de distância que, de outra forma, exigiriam rastreamento manual, reduzindo erros humanos e custos de mão de obra, aumentando a produtividade.
  • Otimização de recursos: Ao conhecer o espaçamento e a proximidade aproximados dos objetos, os recursos (como pessoal ou maquinário) podem ser otimizados, reduzindo o desperdício e melhorando os fluxos de trabalho.
  • Complexidade mínima de configuração: Uma vez configurados, os sistemas de cálculo de distância habilitados por visão são relativamente de baixa manutenção e exigem menos intervenção humana em comparação com outros sistemas que dependem de entrada manual ou maquinário complexo.

Apesar dessas vantagens, também existem algumas limitações a serem lembradas ao implementar tais sistemas. Aqui está uma rápida visão geral dos principais fatores a serem considerados quando se trata de cálculo de distância usando visão computacional:

  • Sensibilidade a fatores ambientais: A precisão do cálculo da distância pode ser afetada por condições de iluminação, sombras, reflexos ou obstruções, levando a possíveis erros ou inconsistências.
  • Preocupações com a privacidade: O uso de visão computacional para rastrear objetos ou pessoas pode levantar questões de privacidade, especialmente em espaços públicos ou ambientes sensíveis onde dados pessoais podem estar envolvidos.
  • Complexidade em cenários multi-objeto: Em ambientes com vários objetos em movimento, calcular com precisão as distâncias entre vários objetos simultaneamente pode levar à confusão, principalmente se estiverem próximos ou se cruzando.

Principais conclusões

Calcular a distância entre objetos usando YOLO11 é uma solução confiável que pode apoiar a tomada de decisões. É especialmente útil em ambientes dinâmicos como armazéns, varejo e gerenciamento de tráfego, onde manter o controle da proximidade dos objetos pode melhorar a eficiência e a segurança. 

O YOLO11 possibilita a automação de tarefas que normalmente exigiriam esforço manual. Embora existam alguns desafios, como a sensibilidade a fatores ambientais e preocupações com a privacidade, os benefícios, como automação, escalabilidade e fácil integração, o tornam impactante. À medida que a visão computacional continua a melhorar, especialmente em áreas como o cálculo de distância, é provável que vejamos uma mudança real na forma como as máquinas interagem e compreendem o ambiente ao seu redor.

Junte-se à nossa comunidade! Explore nosso repositório GitHub para saber mais sobre Vision AI. Se você estiver interessado em aproveitar a visão computacional, confira nossas opções de licenciamento. Saiba como a visão computacional na área da saúde está melhorando a eficiência e veja o impacto da IA na agricultura visitando nossas páginas de soluções! 

Vamos construir o futuro
da IA juntos!

Comece sua jornada com o futuro do aprendizado de máquina

Comece gratuitamente
Link copiado para a área de transferência