Conheça o YOLO26: IA de visão de próxima geração.
Ultralytics
IA de visão

Compreender a deteção de objetos 3D e as suas aplicações

Explora como funciona a deteção de objetos 2D e 3D, as suas principais diferenças e as suas aplicações em áreas como veículos autónomos, robótica e realidade aumentada.

ABAbirami Vina
4 min read
Deteção de objetos 3D de veículos e arredores

Ao longo dos anos, a detecção de objetos tornou-se cada vez mais avançada. Ela progrediu do reconhecimento de objetos em imagens simples bidimensionais (2D) para a identificação de objetos no complexo mundo tridimensional (3D) que nos rodeia. Técnicas iniciais, como o template matching, que envolvia a busca por objetos comparando partes de uma imagem com imagens de referência armazenadas, foram desenvolvidas na década de 1970 e formaram a base para a detecção de objetos em 2D. Na década de 1990, a introdução de tecnologias como LIDAR (Light Detection and Ranging) tornou possível que sistemas capturassem informações de profundidade e espaciais com maior facilidade. Hoje, métodos de fusão multimodal, que combinam imagens 2D com dados 3D, abriram caminho para sistemas de detecção de objetos 3D altamente precisos.

Exemplo de detecção de objetos 3D

Fig 1. Um exemplo de detecção de objetos em 3D.

Neste artigo, vamos explorar o que é a detecção de objetos em 3D, como ela funciona e como se diferencia da detecção de objetos em 2D. Também discutiremos algumas das aplicações da detecção de objetos em 3D. Vamos começar!

Link to this sectionUma visão geral da detecção de objetos em 2D#

Antes de analisarmos a detecção de objetos em 3D, vamos entender como funciona a detecção de objetos em 2D. A detecção de objetos em 2D é uma técnica de visão computacional que permite aos computadores reconhecer e localizar objetos dentro de imagens planas e bidimensionais. Ela funciona analisando a posição horizontal (X) e vertical (Y) de um objeto em uma imagem. Por exemplo, se você fornecer uma imagem de jogadores em um campo de futebol para um modelo de detecção de objetos em 2D como o Ultralytics YOLOv8, ele poderá analisar a imagem e desenhar caixas delimitadoras ao redor de cada objeto (neste caso, os jogadores), identificando precisamente sua localização.

Detecção de objetos 2D YOLOv8 de jogadores em um campo de futebol

Fig 2. Detecção de objetos em 2D com YOLOv8 sendo usada para detectar jogadores em um campo de futebol.

No entanto, a detecção de objetos em 2D tem suas limitações. Como ela considera apenas duas dimensões, não compreende a profundidade. Isso pode tornar difícil julgar quão longe ou quão grande é um objeto. Por exemplo, um objeto grande que está longe pode parecer do mesmo tamanho que um objeto menor que está mais perto, o que pode causar confusão. A falta de informação sobre a profundidade pode causar imprecisões em aplicações como robótica ou realidade aumentada, onde é necessário conhecer o tamanho real e a distância dos objetos. É aí que surge a necessidade da detecção de objetos em 3D.

Link to this sectionGanhando consciência espacial com a detecção de objetos em 3D#

A detecção de objetos em 3D é uma técnica avançada de visão computacional que permite aos computadores identificar objetos em um espaço tridimensional, proporcionando uma compreensão muito mais profunda do mundo ao redor deles. Ao contrário da detecção de objetos em 2D, a detecção de objetos em 3D também leva em consideração dados de profundidade. As informações de profundidade fornecem mais detalhes, como onde um objeto está, quão grande ele é, a que distância se encontra e como está posicionado no mundo real em 3D. Curiosamente, a detecção em 3D também consegue lidar melhor com situações em que um objeto esconde parcialmente o outro (oclusões) e permanece confiável mesmo quando a perspectiva muda. É uma ferramenta poderosa para casos de uso que necessitam de uma consciência espacial precisa.

A detecção de objetos em 3D é vital para aplicações como carros autônomos, robótica e sistemas de realidade aumentada. Ela funciona usando sensores como LiDAR ou câmeras estéreo. Esses sensores criam mapas 3D detalhados do ambiente, conhecidos como nuvens de pontos ou mapas de profundidade. Esses mapas são então analisados para detectar objetos em um ambiente 3D.

Detecção de objetos 3D de um carro

Fig 3. Detecção de objetos em 3D de um carro.

Existem muitos modelos de visão computacional avançados projetados especificamente para lidar com dados 3D, como nuvens de pontos. Por exemplo, o VoteNet é um modelo que utiliza um método chamado votação de Hough para prever onde o centro de um objeto está em uma nuvem de pontos, tornando mais fácil detectar e classificar objetos com precisão. Da mesma forma, o VoxelNet é um modelo que converte nuvens de pontos em uma grade de pequenos cubos chamados voxels para simplificar a análise de dados.

Link to this sectionPrincipais diferenças entre a detecção de objetos em 2D e 3D#

Agora que entendemos a detecção de objetos em 2D e 3D, vamos explorar suas principais diferenças. A detecção de objetos em 3D é mais complicada do que a detecção de objetos em 2D porque trabalha com nuvens de pontos. Analisar dados 3D, como as nuvens de pontos geradas pelo LiDAR, requer muito mais memória e poder computacional. Outra diferença é a complexidade dos algoritmos envolvidos. Os modelos de detecção de objetos em 3D precisam ser mais complexos para serem capazes de lidar com a estimativa de profundidade, análise de formas 3D e análise da orientação de um objeto.

Comparação de detecção de objetos 2D e 3D

Fig 4. Detecção de Objetos em 2D vs 3D.

Os modelos de detecção de objetos em 3D envolvem um trabalho matemático e computacional mais pesado do que os modelos de detecção de objetos em 2D. Processar dados 3D em tempo real pode ser um desafio sem hardware avançado e otimizações. No entanto, essas diferenças tornam a detecção de objetos em 3D mais adequada para aplicações que exigem uma melhor compreensão espacial. Por outro lado, a detecção de objetos em 2D é frequentemente usada para aplicações mais simples, como sistemas de segurança, que precisam de reconhecimento de imagem ou análise de vídeo.

Link to this sectionPrós e contras da detecção de objetos em 3D#

A detecção de objetos em 3D oferece várias vantagens que a destacam dos métodos tradicionais de detecção de objetos em 2D. Ao capturar todas as três dimensões de um objeto, ela fornece detalhes precisos sobre sua localização, tamanho e orientação em relação ao mundo real. Tal precisão é crucial para aplicações como carros autônomos, onde saber a posição exata dos obstáculos é vital para a segurança. Outra vantagem de usar a detecção de objetos em 3D é que ela pode ajudar você a obter uma compreensão muito melhor de como diferentes objetos se relacionam entre si no espaço 3D.

Resolvendo oclusões com detecção de objetos 3D

Fig 5. Resolvendo Oclusões com a Detecção de Objetos em 3D.

Apesar dos muitos benefícios, também existem limitações relacionadas à detecção de objetos em 3D. Aqui estão alguns dos principais desafios para ter em mente:

  • Custos computacionais mais altos: Trabalhar com dados 3D requer recursos de hardware mais potentes, e o custo pode aumentar rapidamente.
  • Requisitos de dados mais complexos: A detecção de objetos em 3D muitas vezes depende de sensores avançados como o LiDAR, que pode ser caro e não estar necessariamente disponível em todos os ambientes.
  • Coleta e processamento de dados: Os requisitos complexos de dados da detecção de objetos em 3D tornam a reunião, preparação e processamento dos grandes conjuntos de dados necessários para treinar os modelos demorados e intensivos em recursos.
  • Aumento da complexidade do modelo: Os modelos usados para a detecção de objetos em 3D são geralmente mais complicados, com mais camadas e parâmetros do que aqueles usados para a detecção de objetos em 2D.

Link to this sectionAplicações da detecção de objetos em 3D#

Agora que discutimos os prós e contras da detecção de objetos em 3D, vamos dar uma olhada mais de perto em alguns dos casos de uso da detecção de objetos em 3D.

Link to this sectionVeículos autônomos#

Em carros autônomos, a detecção de objetos em 3D é vital para perceber o ambiente ao redor do carro. Ela permite que os veículos detectem pedestres, outros carros e obstáculos. Também fornece informações precisas sobre sua posição, tamanho e orientação no mundo real. Os dados detalhados obtidos por meio de sistemas de detecção de objetos em 3D são úteis para uma experiência de direção autônoma muito mais segura para os passageiros a bordo.

Usando detecção de objetos 3D em veículos autônomos

Fig 6. Usando a Detecção de Objetos em 3D em Veículos Autônomos. (fonte: towardsdatascience.com)

Link to this sectionRobótica#

Sistemas robóticos usam a detecção de objetos em 3D para várias aplicações. Eles a utilizam para navegar por diferentes tipos de ambientes, pegar e colocar objetos e interagir com o que os cerca. Esses casos de uso são particularmente importantes em ambientes dinâmicos como armazéns ou instalações de fabricação, onde os robôs precisam entender layouts tridimensionais para funcionar efetivamente.

Um robô móvel usando detecção de objetos 3D

Fig 7. Um Robô Móvel Usando Detecção de Objetos em 3D.

Link to this sectionRealidade aumentada e virtual (AR/VR)#

Outro caso de uso interessante da detecção de objetos em 3D é em aplicações de realidade aumentada e virtual. A detecção de objetos em 3D é usada para posicionar objetos virtuais com precisão em um ambiente realista de VR ou AR. Fazer isso aumenta a experiência geral do usuário com tais tecnologias. Também permite que os sistemas de VR/AR reconheçam e rastreiem objetos físicos, criando ambientes imersivos onde elementos digitais e físicos interagem perfeitamente. Por exemplo, gamers que usam headsets de AR/VR podem obter uma experiência muito mais imersiva com a ajuda da detecção de objetos em 3D. Isso torna as interações com objetos virtuais em espaços 3D muito mais envolventes.

Reconhecimento de objetos 3D usado para uma aplicação de RA

Fig 8. Um exemplo de reconhecimento de objetos em 3D sendo usado para uma aplicação de AR.

Link to this sectionConsiderações finais sobre a detecção de objetos em 3D#

A detecção de objetos em 3D torna possível para os sistemas entenderem a profundidade e o espaço de forma mais eficaz do que os métodos de detecção de objetos em 2D. Ela desempenha um papel fundamental em aplicações como carros autônomos, robôs e AR/VR, onde conhecer o tamanho, a distância e a posição de um objeto é importante. Embora a detecção de objetos em 3D exija mais poder de processamento e dados complexos, sua capacidade de fornecer informações precisas e detalhadas a torna uma ferramenta muito valiosa em muitos campos. À medida que a tecnologia avança, a eficiência e a acessibilidade da detecção de objetos em 3D provavelmente melhorarão, abrindo caminho para uma adoção ainda mais ampla e inovação em diversos setores.

Fique conectado com nossa comunidade para acompanhar as novidades em IA! Visite nosso repositório no GitHub para ver como estamos usando IA para criar soluções de ponta em setores como manufatura e saúde. 🚀

Explore solutions

Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais
Real-time AI that works with your team

IA em robótica

Potencialize máquinas mais inteligentes com modelos Ultralytics YOLO. A IA de visão em robótica impulsiona a navegação autônoma, percepção, rastreamento de objetos e controle em tempo real.

Sabe mais
Real-time AI that works with your team

IA na Logística

Otimize a logística com modelos Ultralytics YOLO. A IA de visão permite a inspeção de pacotes, triagem, rastreamento de veículos e monitoramento de segurança em armazéns em tempo real.

Sabe mais
Real-time AI that works with your team

IA no varejo

Reinvente o varejo com modelos Ultralytics YOLO. A IA de visão impulsiona o rastreamento de inventário, monitoramento de prateleiras, gerenciamento de filas e percepções mais inteligentes sobre o cliente.

Sabe mais
Real-time AI that works with your team

IA na Saúde

Constrói soluções de saúde com modelos Ultralytics YOLO. A visão AI na saúde impulsiona imagens médicas mais rápidas, diagnósticos mais inteligentes e monitorização do paciente.

Sabe mais
Real-time AI that works with your team

IA na Fabricação

Otimize a fabricação com modelos Ultralytics YOLO. A IA de visão impulsiona o controle de qualidade, detecção de defeitos, conformidade com EPI e automação de linhas de montagem.

Sabe mais
Real-time AI that works with your operation

IA no Setor Automóvel

Aplica visão computacional no setor automóvel com modelos Ultralytics YOLO. A visão AI eleva a segurança rodoviária, a assistência ao condutor e a automação de veículos para estradas mais inteligentes.

Sabe mais
Real-time AI tailored to your operation

IA na Agricultura

Leva a visão AI para a agricultura inteligente com os modelos Ultralytics YOLO. Potencia a monitorização de culturas, o seguimento de gado e a agricultura de precisão para colheitas maiores e mais inteligentes.

Sabe mais

Vamos construir o futuro da IA juntos!

Começa a tua jornada com o futuro da aprendizagem automática