Yolo Vision Shenzhen
Shenzhen
Junte-se agora

Entendendo a detecção de objetos 3D e suas aplicações

Abirami Vina

4 min de leitura

12 de setembro de 2024

Explore como funciona a detecção de objetos 2D e 3D, suas principais diferenças e suas aplicações em áreas como veículos autônomos, robótica e realidade aumentada.

Ao longo dos anos, a detecção de objetos se tornou cada vez mais avançada. Ela progrediu do reconhecimento de objetos em imagens bidimensionais (2D) simples para a identificação de objetos no complexo mundo tridimensional (3D) ao nosso redor. As primeiras técnicas, como a correspondência de modelos, que envolvia a localização de objetos comparando partes de uma imagem com imagens de referência armazenadas, foram desenvolvidas na década de 1970 e formaram a base para a detecção de objetos 2D. Na década de 1990, a introdução de tecnologias como o LIDAR (Light Detection and Ranging) tornou possível para os sistemas capturar informações de profundidade e espaciais com mais facilidade. Hoje, os métodos de fusão multimodal, que combinam imagens 2D com dados 3D, abriram caminho para sistemas de detecção de objetos 3D altamente precisos.

__wf_reserved_inherit
Fig 1. Um exemplo de detecção de objetos 3D.

Neste artigo, exploraremos o que é a detecção de objetos 3D, como ela funciona e como ela é diferente da detecção de objetos 2D. Também discutiremos algumas das aplicações da detecção de objetos 3D. Vamos começar!

Uma visão geral da detecção de objetos 2D

Antes de analisarmos a deteção de objectos 3D, vamos compreender como funciona a deteção de objectos 2D. A deteção de objectos 2D é uma técnica de visão por computador que permite aos computadores reconhecer e localizar objectos em imagens bidimensionais planas. Funciona através da análise da posição horizontal (X) e vertical (Y) de um objeto numa imagem. Por exemplo, se passar uma imagem de jogadores num campo de futebol para um modelo de deteção de objectos 2D como o Ultralytics YOLOv8este pode analisar a imagem e desenhar caixas delimitadoras à volta de cada objeto (neste caso, os jogadores), identificando com precisão a sua localização.

__wf_reserved_inherit
Fig. 2. Deteção de objectos YOLOv8 2D utilizada para detect jogadores num campo de futebol.

No entanto, a detecção de objetos 2D tem suas limitações. Como considera apenas duas dimensões, não entende a profundidade. Isso pode dificultar a avaliação da distância ou do tamanho de um objeto. Por exemplo, um objeto grande distante pode parecer do mesmo tamanho que um objeto menor que está mais perto, o que pode ser confuso. A falta de informações de profundidade pode causar imprecisões em aplicações como robótica ou realidade aumentada, onde conhecer o tamanho e a distância reais dos objetos é necessário. É aí que entra a necessidade da detecção de objetos 3D.

Obtenção de consciência espacial com deteção de objetos 3D

A detecção de objetos 3D é uma técnica avançada de visão computacional que permite aos computadores identificar objetos em um espaço tridimensional, proporcionando-lhes uma compreensão muito mais profunda do mundo ao seu redor. Ao contrário da detecção de objetos 2D, a detecção de objetos 3D também leva em consideração dados sobre profundidade. As informações de profundidade fornecem mais detalhes, como onde um objeto está, quão grande ele é, quão longe ele está e como está posicionado no mundo 3D real. Curiosamente, a detecção 3D também pode lidar melhor com situações em que um objeto oculta parcialmente outro (oclusões) e permanece confiável mesmo quando a perspectiva muda. É uma ferramenta poderosa para casos de uso que precisam de reconhecimento espacial preciso.

A deteção de objectos 3D é vital para aplicações como carros autónomos, robótica e sistemas de realidade aumentada. Funciona através da utilização de sensores como o LiDAR ou câmaras estéreo. Estes sensores criam mapas 3D detalhados do ambiente, conhecidos como nuvens de pontos ou mapas de profundidade. Estes mapas são depois analisados para detect objectos num ambiente 3D.

__wf_reserved_inherit
Fig 3. Detecção de objeto 3D de um carro.

Existem muitos modelos avançados de visão computacional concebidos especificamente para lidar com dados 3D, como nuvens de pontos. Por exemplo, o VoteNet é um modelo que utiliza um método chamado votação Hough para prever onde se encontra o centro de um objeto numa nuvem de pontos, facilitando a detect e classify objectos com precisão. Da mesma forma, o VoxelNet é um modelo que converte nuvens de pontos numa grelha de pequenos cubos chamados voxels para simplificar a análise de dados.

Principais diferenças entre a detecção de objetos 2D e 3D

Agora que entendemos a detecção de objetos 2D e 3D, vamos explorar suas principais diferenças. A detecção de objetos 3D é mais complicada do que a detecção de objetos 2D porque funciona com nuvens de pontos. A análise de dados 3D, como as nuvens de pontos geradas pelo LiDAR, exige muito mais memória e poder de computação. Outra diferença é a complexidade dos algoritmos envolvidos. Os modelos de detecção de objetos 3D precisam ser mais complexos para serem capazes de lidar com a estimativa de profundidade, a análise de formas 3D e a análise da orientação de um objeto. 

__wf_reserved_inherit
Fig 4. Detecção de Objetos 2D vs 3D.

Os modelos de detecção de objetos 3D envolvem um trabalho matemático e computacional maior do que os modelos de detecção de objetos 2D. Processar dados 3D em tempo real pode ser um desafio sem hardware avançado e otimizações. No entanto, essas diferenças tornam a detecção de objetos 3D mais adequada para aplicações que exigem melhor compreensão espacial. Por outro lado, a detecção de objetos 2D é frequentemente usada para aplicações mais simples, como sistemas de segurança que precisam de reconhecimento de imagem ou análise de vídeo

Prós e contras da detecção de objetos 3D

A detecção de objetos 3D oferece várias vantagens que a destacam dos métodos tradicionais de detecção de objetos 2D. Ao capturar todas as três dimensões de um objeto, ela fornece detalhes precisos sobre sua localização, tamanho e orientação em relação ao mundo real. Essa precisão é crucial para aplicações como carros autônomos, onde conhecer a posição exata dos obstáculos é vital para a segurança. Outra vantagem de usar a detecção de objetos 3D é que ela pode ajudá-lo a obter uma compreensão muito melhor de como diferentes objetos se relacionam entre si no espaço 3D. 

__wf_reserved_inherit
Fig 5. Resolvendo Oclusões com Detecção de Objetos 3D.

Apesar dos muitos benefícios, também existem limitações relacionadas à detecção de objetos 3D. Aqui estão alguns dos principais desafios a serem considerados:

  • Custos computacionais mais elevados: Trabalhar com dados 3D requer recursos de hardware mais poderosos, e o custo pode aumentar rapidamente. 
  • Requisitos de dados mais complexos: A detecção de objetos 3D geralmente depende de sensores avançados como o LiDAR, que pode ser caro e não estar necessariamente disponível em todos os ambientes. 
  • Coleta e processamento de dados: Os complexos requisitos de dados da detecção de objetos 3D tornam a coleta, preparação e processamento dos grandes conjuntos de dados necessários para treinar os modelos demorados e com uso intensivo de recursos.
  • Maior complexidade do modelo: Os modelos usados para a detecção de objetos 3D são geralmente mais complexos, com mais camadas e parâmetros do que os usados para a detecção de objetos 2D. 

Aplicações da detecção de objetos 3D

Agora que discutimos os prós e os contras da detecção de objetos 3D, vamos dar uma olhada mais de perto em alguns dos casos de uso da detecção de objetos 3D.

Veículos autônomos

Nos automóveis de condução autónoma, a deteção de objectos 3D é vital para a perceção do ambiente em redor do automóvel. Permite aos veículos detect peões, outros carros e obstáculos. Também fornece informações precisas sobre a sua posição, tamanho e orientação no mundo real. Os dados detalhados obtidos através dos sistemas de deteção de objectos 3D são úteis para uma experiência de condução autónoma muito mais segura para os passageiros a bordo. 

__wf_reserved_inherit
Fig 6. Utilização da detecção de objetos 3D em veículos autônomos. (fonte: towardsdatascience.com)

Robótica

Os sistemas robóticos usam detecção de objetos 3D para diversas aplicações. Eles a utilizam para navegar por diferentes tipos de ambientes, pegar e colocar objetos e interagir com seus arredores. Esses casos de uso são particularmente importantes em ambientes dinâmicos, como armazéns ou instalações de fabricação, onde os robôs precisam entender layouts tridimensionais para funcionar de forma eficaz. 

__wf_reserved_inherit
Fig 7. Um Robô Móvel Usando Detecção de Objetos 3D.

Realidade aumentada e realidade virtual (RA/RV)

Outro caso de utilização interessante da deteção de objectos 3D é em aplicações de realidade aumentada e virtual. A deteção de objectos 3D é utilizada para colocar com precisão objectos virtuais num ambiente realista de RV ou RA. Isto aumenta a experiência geral do utilizador dessas tecnologias. Também permite que os sistemas de RV/RA reconheçam e track objectos físicos, criando ambientes imersivos em que os elementos digitais e físicos interagem sem problemas. Por exemplo, os jogadores que utilizam auscultadores AR/VR podem ter uma experiência muito mais imersiva com a ajuda da deteção de objectos 3D. Torna as interações com objectos virtuais em espaços 3D muito mais envolventes.

__wf_reserved_inherit
Fig 8. Um exemplo de reconhecimento de objetos 3D sendo usado para uma aplicação de RA. 

Considerações finais sobre a detecção de objetos 3D

A detecção de objetos 3D possibilita que os sistemas compreendam a profundidade e o espaço de forma mais eficaz do que os métodos de detecção de objetos 2D. Ela desempenha um papel fundamental em aplicações como carros autônomos, robôs e AR/VR, onde conhecer o tamanho, a distância e a posição de um objeto é importante. Embora a detecção de objetos 3D exija mais poder de processamento e dados complexos, sua capacidade de fornecer informações precisas e detalhadas a torna uma ferramenta muito valiosa em muitos campos. À medida que a tecnologia avança, a eficiência e a acessibilidade da detecção de objetos 3D provavelmente melhorarão, abrindo caminho para uma adoção e inovação ainda mais amplas em vários setores.

Mantenha-se conectado com a nossa comunidade para ficar por dentro das últimas novidades em IA! Visite o nosso repositório GitHub para ver como estamos usando a IA para criar soluções de ponta em setores como manufatura e saúde. 🚀

Vamos construir o futuro
da IA juntos!

Comece sua jornada com o futuro do aprendizado de máquina

Comece gratuitamente