O que é a deteção de caixa delimitadora orientada (OBB)?

5 min. de leitura

9 de junho de 2025

Explore a forma como a deteção de caixas delimitadoras orientadas (OBB) melhora a deteção de objectos, identificando com precisão objectos rodados em imagens em aplicações do mundo real.

Reconhecer objectos, independentemente da forma como estão dispostos ou da direção para onde estão virados, é algo natural para nós, humanos. Quer se trate de carros num cruzamento ou de barcos num porto, podemos facilmente dizer o que são e para que direção estão a apontar. No entanto, para os sistemas de inteligência artificial (IA), não é assim tão simples.

Por exemplo, a visão por computador, um ramo da IA centrado na compreensão de imagens e vídeos, permite tarefas como a deteção de objectos, que ajuda as máquinas a identificar e localizar objectos numa cena. A deteção de objectos tradicional baseia-se em caixas delimitadoras alinhadas por eixos para desenhar caixas à volta dos objectos. Estas caixas têm lados rectos e ângulos rectos fixos. Esta abordagem funciona bem quando os objectos estão na vertical e não muito próximos uns dos outros. 

Mas quando os objectos estão inclinados, rodados ou próximos uns dos outros, a deteção de objectos tradicional tem muitas vezes dificuldade em captá-los com precisão. Para lidar com estas situações mais complexas, foram introduzidas técnicas como a deteção de caixas delimitadoras orientadas (OBB). Ao contrário das caixas delimitadoras padrão, as OBBs podem rodar para corresponder ao ângulo e à forma do objeto, permitindo um ajuste mais apertado e preciso.

Os modelos de visão por computador, como o Ultralytics YOLO11, que suportam a deteção de OBB, permitem uma série de aplicações em tempo real, especialmente em cenários em que a orientação do objeto é importante, como a vigilância aérea. Para além disso, a deteção de OBB é também utilizada nos cuidados de saúde, na agricultura e na análise de documentos.

Neste artigo, vamos explorar o que é a deteção de OBB, como funciona e onde está a ser aplicada em cenários do mundo real. Vamos começar!

__wf_reserved_inherit
Fig. 1. Exemplo de demonstração da utilização do YOLO11 para a deteção de OBB em barcos.

O que é uma caixa delimitadora orientada?

Uma caixa delim itadora orientada é um tipo de caixa retangular utilizada na visão por computador para representar objectos detectados numa imagem. Enquanto as caixas delimitadoras padrão estão alinhadas com os eixos horizontal e vertical da imagem, os OBBs podem rodar para corresponder ao ângulo real do objeto.

Esta capacidade de rotação traz várias vantagens para a mesa. Os OBBs podem alinhar-se mais estreitamente com a orientação de um objeto, permitindo que a caixa se ajuste firmemente à forma e direção do objeto. Como resultado, a deteção torna-se mais exacta e precisa.

Os OBBs são especialmente úteis quando os objectos não estão perfeitamente na vertical, como um carro a virar numa estrada curva em imagens aéreas, um livro inclinado numa secretária ou um tumor rodado num exame médico. Ao fazer corresponder o ângulo de um objeto com maior precisão, os OBBs melhoram o desempenho da deteção, reduzem a interferência de fundo e são particularmente adequados para aplicações em que a orientação de um objeto é tão importante como a sua posição.

__wf_reserved_inherit
Fig. 2. Comparação entre a deteção de objectos e a deteção de OBB.

Deteção de OBB vs. deteção de objectos

A deteção de OBB e a deteção de objectos tradicional podem parecer semelhantes à primeira vista, mas são utilizadas de formas diferentes e para situações diferentes. Vamos ver mais de perto como se comparam com um exemplo.

Os modelos de visão por computador, como o YOLO11, podem ser treinados para detetar e classificar objectos em várias aplicações do mundo real, como a inspeção industrial. Considere uma linha de montagem de fábrica onde diferentes peças de máquinas se movem ao longo de uma correia transportadora. Algumas peças podem estar bem colocadas, mas outras podem estar ligeiramente rodadas, inclinadas ou sobrepostas devido à vibração ou velocidade.

A deteção de objectos tradicional utiliza caixas rectangulares verticais que se alinham com as margens horizontais e verticais da imagem. Assim, quando uma peça é rodada, a caixa pode não encaixar corretamente - pode deixar de fora parte do objeto ou incluir demasiado do fundo. Isto pode tornar as detecções menos precisas e mais difíceis para o sistema identificar a peça com confiança.

Agora, digamos que está a utilizar a deteção de OBB. Neste caso, o modelo pode desenhar uma caixa que roda para corresponder ao ângulo exato de cada peça. Uma engrenagem inclinada ou um componente angular será firmemente delimitado por uma caixa que se adapta à sua forma e direção. Isto significa uma melhor precisão, menos erros e resultados mais fiáveis, especialmente no que diz respeito a casos de utilização como o controlo de qualidade automatizado ou a triagem robótica.

Modelos populares de deteção de OBB

Agora que compreendemos melhor o que é a deteção de OBB, vamos analisar alguns dos modelos de IA de visão mais utilizados que a suportam.

Foram desenvolvidos vários modelos avançados de visão por computador especificamente para a deteção de objectos rodados ou inclinados. Entre eles, os modelos Ultralytics YOLO são particularmente conhecidos pelas suas capacidades fiáveis e eficientes de deteção de OBB.

As versões anteriores, como o Ultralytics YOLOv5, foram concebidas para a deteção de objectos padrão. As iterações posteriores, como o Ultralytics YOLOv8 e o mais recente YOLO11, introduziram o suporte nativo para a deteção de OBB. O YOLO11, em particular, oferece precisão de última geração sem comprometer a velocidade, tornando-o uma opção impactante para aplicações em tempo real.

Os modelos YOLO11 OBB pré-treinados, como o YOLO11n-obb, são treinados em conjuntos de dados como o DOTAv1, que consiste em imagens aéreas anotadas com uma gama de classes de objectos como aviões, navios e campos de ténis que aparecem em vários ângulos e orientações. 

Além disso, estes modelos estão disponíveis em cinco tamanhos diferentes, desde nano (n-obb) a extra-grande (x-obb), para corresponder a diferentes necessidades de desempenho. Esta versatilidade permite-lhes ser aplicados em várias indústrias - desde a monitorização de infra-estruturas urbanas e inspeção de maquinaria até à leitura de texto distorcido em documentos digitalizados.

Treino personalizado YOLO11 para deteção de caixa delimitadora orientada

Em muitas situações do mundo real, os objectos que precisa de detetar podem ser completamente diferentes dos que constam dos conjuntos de dados de treino padrão. Por exemplo, objectos como ferramentas numa linha de produção, embalagens de produtos ou componentes numa placa de circuitos podem ser rodados, colocados de forma irregular ou ter uma forma diferente. 

Para detetar com precisão estes objectos personalizados, especialmente quando a orientação é importante, é importante treinar modelos como o YOLO11 utilizando as suas próprias imagens e etiquetas. Este processo é conhecido como treino personalizado

Aqui está um olhar mais atento ao processo passo-a-passo para treinar o YOLO11 para a deteção de OBB:

  • Coleção de imagens: Reúna imagens que mostrem os seus objectos alvo de diferentes ângulos, posições e ambientes do mundo real.
  • Anotação de objectos: Rotular cada objeto utilizando caixas delimitadoras rodadas (OBBs) para captar a sua localização e orientação utilizando ferramentas de anotação com suporte para OBB.
  • Preparação do conjunto de dados: Organize suas imagens e rótulos na estrutura de diretório YOLO e crie um arquivo de configuração YAML com seus nomes de classe e caminhos de conjunto de dados.
  • Treino do modelo: Escolha uma versão do modelo YOLO11 que se adapte às suas necessidades e execute o processo de formação para que o modelo possa aprender com as suas imagens rotuladas.
  • Avaliação e implementação: Teste o seu modelo treinado em novas imagens, avalie a sua precisão e implemente-o em aplicações práticas como fabrico, vigilância aérea ou análise de documentos.

Aplicações activadas pela deteção de OBB

Os objectos que estão descentrados ou inclinados são bastante comuns em cenários da vida real. Vamos analisar alguns exemplos em que a deteção de OBB faz uma diferença real ao detetar com precisão estes objectos.

Análise de imagens de raios X com deteção de OBB

A deteção de OBB pode levar a análise de imagens médicas mais longe, melhorando a precisão. As imagens médicas incluem frequentemente estruturas anatómicas, como tumores, órgãos ou ossos. Estas estruturas aparecem frequentemente com formas irregulares e orientações variadas. Uma vez que os OBBs podem rodar para corresponder ao ângulo de um objeto, proporcionam uma localização e medição mais precisas, o que é fundamental para o diagnóstico e o planeamento do tratamento.

Esta abordagem é especialmente eficaz quando se trata de analisar imagens de raios X de fracturas ósseas, em que a posição e o alinhamento dos ossos são factores-chave. Por exemplo, a deteção OBB foi utilizada para analisar radiografias pediátricas do cotovelo. Ao ajustar-se à orientação dos ossos, ajudou a melhorar a precisão da deteção. 

__wf_reserved_inherit
Fig. 3. Radiografias (a, d) com deteção de objectos (b, e) e deteção de caixas delimitadoras orientadas (c, f).

Vigilância aérea com base na deteção de OBB

A vigilância aérea é uma ferramenta essencial em sectores como a segurança pública, a monitorização ambiental e o planeamento urbano. As imagens captadas por drones ou satélites podem ajudar a identificar objectos como navios, veículos e edifícios. No entanto, nestas imagens, os objectos aparecem frequentemente pequenos e em ângulos invulgares, o que torna mais difícil a sua deteção precisa.

A deteção de OBB resolve este problema inclinando as caixas delimitadoras para corresponder ao ângulo de cada objeto. Isto leva a medições mais precisas do tamanho e orientação de um objeto, apoiando uma melhor tomada de decisões em áreas como o planeamento urbano, defesa, resposta a catástrofes e monitorização ambiental.

Um exemplo interessante de deteção de OBB é o seguimento de navios na vigilância marítima. As imagens de satélite captam frequentemente navios em ângulos e tamanhos diferentes devido às condições climatéricas, à iluminação ou ao movimento. Os OBBs podem adaptar-se a estas alterações, melhorando a deteção, especialmente de navios mais pequenos ou parcialmente obscurecidos.

__wf_reserved_inherit
Fig. 4. Um olhar sobre a utilização da deteção de OBB para a vigilância marítima.

Utilização da deteção de OBB na agricultura

A seleção das culturas após a colheita é um passo crucial para garantir a sua qualidade antes de serem embaladas e enviadas para o mercado. Embora muitos sistemas funcionem bem para frutos redondos como maçãs e laranjas, as culturas longas e estreitas, como cenouras ou rebentos de Zizania, podem ser muito mais difíceis de manusear. As suas formas variam e muitas vezes acabam em ângulos diferentes, tornando-as difíceis de detetar e classificar com precisão.

Para resolver este problema, os investigadores desenvolveram um sistema que utiliza a deteção de caixas delimitadoras orientadas (OBB) para identificar e classificar estas culturas com maior precisão. O sistema pode detetar várias culturas numa imagem, mesmo que estejam inclinadas ou sobrepostas, e avaliar a sua qualidade e posição em tempo real.

Prós e contras da deteção de OBB

Eis algumas das vantagens da utilização da deteção de OBB:

  • Melhoria dos dados para as tarefas a jusante: As tarefas de visão por computador, como a segmentação de instâncias e o seguimento de objectos, podem ter um melhor desempenho quando recebem detecções de objectos mais precisas.

  • Raciocínio espacial melhorado: Ao capturar o ângulo de orientação, os OBBs permitem compreender o alinhamento e a direção de um objeto.

  • Redução da sobreposição em cenas com muita gente: Os OBBs reduzem a ambiguidade, ajustando melhor os objectos, mesmo em cenas movimentadas ou desordenadas.

Apesar de ajudar a melhorar a precisão da deteção em cenas complexas, a deteção de OBB tem algumas limitações a considerar:

  • Maior sensibilidade ao ruído: Pequenos erros na previsão de ângulos podem ter um impacto maior na precisão da deteção, especialmente para objectos muito compactados ou alongados.
  • São necessárias ferramentas especializadas: Uma vez que nem todas as plataformas de rotulagem e formação suportam nativamente OBBs, trabalhar com eles pode exigir ferramentas ou configurações adicionais.

  • Disponibilidade limitada de conjuntos de dados: Em comparação com a deteção de objectos padrão, existem atualmente menos conjuntos de dados disponíveis publicamente com anotações OBB, o que pode tornar um pouco mais difícil começar ou comparar resultados.

Principais conclusões

A deteção de caixas delimitadoras orientadas facilita às soluções de visão por computador o reconhecimento de objectos que não estão perfeitamente direitos ou alinhados. Ao capturar a posição e a orientação dos objectos, a deteção de OBB aumenta a precisão em casos de utilização no mundo real, como a digitalização de imagens médicas, a monitorização de terrenos agrícolas ou a análise de fotografias de satélite.

Com modelos como o YOLO11 a tornar a deteção de OBB mais acessível, está a tornar-se uma escolha prática para muitas indústrias. Quer esteja a lidar com objectos inclinados, sobrepostos ou com formas estranhas, a deteção de OBB acrescenta uma camada extra de precisão que os métodos padrão muitas vezes não conseguem.

Curioso sobre IA? Explore o nosso repositório GitHub, ligue-se à nossa comunidade e verifique as nossas opções de licenciamento para iniciar o seu projeto de visão computacional. Saiba mais sobre inovações como IA no varejo e visão computacional no setor de logística em nossas páginas de soluções.

Vamos construir juntos o futuro
da IA!

Comece a sua viagem com o futuro da aprendizagem automática

Comece gratuitamente
Ligação copiada para a área de transferência