Yolo Vision Shenzhen
Shenzhen
Junte-se agora

Como calcular a distância usando modelos de visão computacional?

Abirami Vina

4 min de leitura

3 de abril de 2025

Saiba como o cálculo da distância em aplicações de visão por computador utilizando o Ultralytics YOLO11 ajuda a medir a proximidade de objectos em tempo real.

Quando você está atravessando a rua e vê um carro vindo em sua direção, você pode dizer instantaneamente a que distância aproximada ele está. Esse julgamento rápido, quase instintivo, é graças a uma compreensão espacial do seu entorno. Com base nesse sentido, você pode decidir se acelera, para ou continua andando. 

Da mesma forma, a visão computacional é um ramo da inteligência artificial (IA) que possibilita que as máquinas desenvolvam uma compreensão de seus arredores, interpretando dados visuais. Assim como você pode avaliar a proximidade de um carro para tomar decisões rápidas, os modelos de visão computacional podem analisar imagens e vídeos, ajudando as máquinas a sentir e reagir ao mundo ao seu redor.

Por exemplo, Ultralytics YOLO11 é um modelo de visão por computador que pode detect e track objectos em imagens e vídeos em tempo real. Simplificando, YOLO11 funciona olhando para toda a imagem de uma só vez, e não em partes, o que o torna mais rápido e mais eficiente. Também pode lidar com tarefas de visão computacional como segmentação de instâncias, estimativa de pose e classificação de imagens.

Em particular, as capacidades do YOLO11 podem ser utilizadas para calcular a distância entre objectos, o que é útil em muitas áreas como a produção, o comércio e a gestão de multidões, ajudando a melhorar a segurança e a eficiência.

Neste artigo, vamos explorar a forma como YOLO11 pode ser utilizado para o cálculo de distâncias em aplicações de visão por computador, a sua importância e o seu impacto em diferentes sectores.

__wf_reserved_inherit
Fig. 1. Um exemplo de utilização do YOLO para calcular a distância de aterragem de um avião.

Uma visão geral do cálculo de distância em visão computacional

O cálculo de distância em visão computacional envolve detectar, localizar e medir os pixels entre dois objetos em uma imagem. Pixels são as unidades individuais que compõem uma imagem digital, cada um representando um único ponto com uma cor ou valor de intensidade específico. 

Para converter medidas de pixels em distâncias do mundo real, a calibração é fundamental. Você pode pensar nisso como usar uma régua para medir algo e, em seguida, usar essa medida para entender o tamanho de outros objetos. Ao referenciar objetos com tamanhos conhecidos, a calibração cria uma ligação entre os pixels e as distâncias físicas reais.

Vejamos um exemplo para ver como isso funciona. Na imagem abaixo, a moeda é o objeto de referência, e seu tamanho (0,9 pol. por 1,0 pol.) é conhecido. Ao comparar as medidas de pixels dos outros objetos com o tamanho da moeda, podemos calcular seu tamanho no mundo real.

__wf_reserved_inherit
Fig 2. Uma moeda pode ser usada como referência para medir o tamanho real de outros objetos.

No entanto, o cálculo de distância é feito em um plano bidimensional (2D), o que significa que ele mede apenas as distâncias horizontal e vertical entre os objetos. Isso é diferente da estimativa de profundidade, que mede a distância dos objetos no espaço tridimensional, incluindo sua distância da câmera.

Embora as câmeras de profundidade possam medir a profundidade real e fornecer informações espaciais mais detalhadas, em muitos casos, uma distância calibrada simples é suficiente. Por exemplo, saber a distância entre objetos em um plano 2D funciona bem para tarefas como rastrear objetos ou gerenciar filas, portanto, a estimativa de profundidade não é necessária nessas situações.

Compreender como funciona o cálculo da distância utilizando o YOLO11

Em seguida, vamos ver como calcular a distância entre dois objectos utilizando o suporte do YOLO11para deteção e seguimento de objectos. Aqui está um resumo:

  • Detetar e seguir objectos: YOLO11 pode ser utilizado para detect objectos, reconhecendo-os num fotograma e acompanhando o seu movimento ao longo dos fotogramas de um vídeo. Atribui uma ID track única a cada objeto, permitindo ao sistema monitorizar a sua posição e movimento ao longo do vídeo.
  • Caixas de contorno: As caixas delimitadoras são desenhadas à volta dos objectos detectados com base nos resultados de deteção de objectos do YOLO11, que definem a sua localização na imagem.
  • Seleção de objectos: Podem ser selecionados dois objectos para focar, e YOLO11 actualiza as caixas delimitadoras à medida que os objectos se movem em tempo real.
  • Cálculo do centroide: Os centroides (os pontos centrais das bounding boxes dos dois objetos) são calculados com base nas coordenadas dos cantos da bounding box, representando as posições dos objetos.
  • Cálculo de distância: Os centroides dos dois objetos podem então ser usados para calcular a distância euclidiana entre eles. A distância euclidiana é a distância em linha reta entre dois pontos em um plano 2D, calculada usando as diferenças nas direções horizontal e vertical. Isso fornece a distância entre os dois objetos em pixels.

É importante ter em mente que as distâncias calculadas usando este método são apenas estimativas, pois são baseadas em medidas de pixels 2D.

__wf_reserved_inherit
Fig. 3. Utilização do Ultralytics YOLO para detect uma pessoa e calcular distâncias. 

O impacto da estimativa de distância YOLO

Considerando que o cálculo de distâncias utilizando o YOLO11 é uma estimativa, pode estar a perguntar-se: Onde é que isto pode ser utilizado e como é que pode fazer a diferença? 

Uma vez que são utilizadas calibrações para chegar a estas estimativas de distância, estas são suficientemente precisas para ajudar em muitas situações práticas. A estimativa de distância do YOLO11é particularmente útil em ambientes dinâmicos, como armazéns, onde os objectos estão constantemente em movimento e são necessários ajustes em tempo real para manter as coisas a funcionar sem problemas.

Um exemplo interessante é a utilização do YOLO11 para track pacotes num tapete rolante e estimar a distância entre eles em tempo real. Isto ajuda os gestores de armazém a certificarem-se de que as embalagens estão devidamente espaçadas, evitando colisões e mantendo as coisas a funcionar corretamente. 

Em tais casos, uma distância exata nem sempre é necessária. Normalmente, um intervalo ou limite para a distância ideal é definido, então uma estimativa funciona bem para esses tipos de aplicações.

__wf_reserved_inherit
Fig. 4. Deteção de pacotes utilizando YOLO11 e cálculo da distância entre eles.

Cálculo de Distância em Aplicações de Visão Computacional

Várias aplicações de visão por computador podem beneficiar do cálculo da distância entre objectos utilizando o YOLO11. Na análise de retalho, por exemplo, ajuda a melhorar a gestão de filas de espera, acompanhando as posições dos clientes em tempo real. Isso possibilita que as empresas aloquem melhor os recursos, reduzam os tempos de espera e criem uma experiência de compra mais suave. Ao ajustar dinamicamente os níveis de pessoal e gerir o fluxo de clientes, as lojas podem evitar a sobrelotação e otimizar a utilização do espaço.

Do mesmo modo, na gestão do tráfego, a estimativa da distância ajuda a monitorizar o espaçamento entre veículos e a analisar os padrões de tráfego. Esta informação pode ser utilizada para detect comportamentos perigosos, como o "tailgating", e ajustar os sinais de trânsito para manter o tráfego a fluir sem problemas. Pode ajudar a tornar as estradas mais seguras, identificando potenciais problemas e melhorando a gestão global do tráfego em tempo real.

__wf_reserved_inherit
Fig 5. O cálculo de distância habilitado por visão pode ser usado para monitorar o tráfego.

Outro uso exclusivo dessa tecnologia surgiu durante a pandemia de COVID-19, quando ajudou a promover o distanciamento social. Garantiu que as pessoas mantivessem uma distância segura em espaços públicos, lojas e hospitais, reduzindo o risco de propagação do vírus. 

Ao rastrear distâncias em tempo real, alertas podiam ser enviados quando os indivíduos estavam muito próximos, facilitando a resposta rápida de empresas e profissionais de saúde e mantendo um ambiente mais seguro para todos.

Prós e contras do cálculo de distância em visão computacional

Agora que discutimos algumas das aplicações do cálculo de distância usando visão computacional, aqui está uma análise mais detalhada dos benefícios associados:

  • Automação: A IA de visão pode automatizar tarefas de cálculo de distância que, de outra forma, exigiriam rastreamento manual, reduzindo erros humanos e custos de mão de obra, aumentando a produtividade.
  • Otimização de recursos: Ao conhecer o espaçamento e a proximidade aproximados dos objetos, os recursos (como pessoal ou maquinário) podem ser otimizados, reduzindo o desperdício e melhorando os fluxos de trabalho.
  • Complexidade mínima de configuração: Uma vez configurados, os sistemas de cálculo de distância habilitados por visão são relativamente de baixa manutenção e exigem menos intervenção humana em comparação com outros sistemas que dependem de entrada manual ou maquinário complexo.

Apesar dessas vantagens, também existem algumas limitações a serem lembradas ao implementar tais sistemas. Aqui está uma rápida visão geral dos principais fatores a serem considerados quando se trata de cálculo de distância usando visão computacional:

  • Sensibilidade a fatores ambientais: A precisão do cálculo da distância pode ser afetada por condições de iluminação, sombras, reflexos ou obstruções, levando a possíveis erros ou inconsistências.
  • Questões de privacidade: A utilização da visão computacional para track objectos ou pessoas pode levantar questões de privacidade, especialmente em espaços públicos ou ambientes sensíveis onde possam estar envolvidos dados pessoais.
  • Complexidade em cenários multi-objeto: Em ambientes com vários objetos em movimento, calcular com precisão as distâncias entre vários objetos simultaneamente pode levar à confusão, principalmente se estiverem próximos ou se cruzando.

Principais conclusões

O cálculo da distância entre objectos utilizando o YOLO11 é uma solução fiável que pode apoiar a tomada de decisões. É especialmente útil em ambientes dinâmicos como armazéns, retalho e gestão de tráfego, onde o track da proximidade de objectos pode melhorar a eficiência e a segurança. 

YOLO11 torna possível automatizar tarefas que normalmente exigiriam esforço manual. Embora existam alguns desafios, como a sensibilidade a factores ambientais e as preocupações com a privacidade, as vantagens, como a automatização, a escalabilidade e a fácil integração, tornam-na impactante. À medida que a visão por computador continua a melhorar, especialmente em áreas como o cálculo da distância, é provável que assistamos a uma verdadeira mudança na forma como as máquinas interagem e compreendem o que as rodeia.

Junte-se à nossa comunidade! Explore nosso repositório GitHub para saber mais sobre Vision AI. Se você estiver interessado em aproveitar a visão computacional, confira nossas opções de licenciamento. Saiba como a visão computacional na área da saúde está melhorando a eficiência e veja o impacto da IA na agricultura visitando nossas páginas de soluções! 

Vamos construir o futuro
da IA juntos!

Comece sua jornada com o futuro do aprendizado de máquina

Comece gratuitamente