Yolo Vision Shenzhen
Shenzhen
Junte-se agora

O que é detecção de bounding box orientado (OBB)?

Leitura de 5 minutos

9 de junho de 2025

Explore como a detecção de caixa delimitadora orientada (OBB) aprimora a detecção de objetos, identificando com precisão objetos rotacionados em imagens em aplicações do mundo real.

Reconhecer objetos, independentemente de como estejam dispostos ou para que lado estejam virados, é natural para nós, humanos. Sejam carros em um cruzamento ou barcos em um porto, podemos facilmente dizer o que são e para que direção estão apontando. No entanto, para sistemas de inteligência artificial (IA), não é tão simples.

Por exemplo, a visão computacional, um ramo da IA focado na compreensão de imagens e vídeos, permite tarefas como a deteção de objetos, que ajuda as máquinas a identificar e localizar objetos dentro de uma cena. A deteção de objetos tradicional depende de caixas delimitadoras alinhadas ao eixo para desenhar caixas à volta dos objetos. Estas caixas têm lados retos e ângulos retos fixos. Esta abordagem funciona bem quando os objetos estão na vertical e não muito próximos uns dos outros. 

Mas quando os objetos estão inclinados, girados ou próximos uns dos outros, a detecção de objetos tradicional geralmente tem dificuldades para capturá-los com precisão. Para lidar com essas situações mais complexas, técnicas como a detecção de caixa delimitadora orientada (OBB) foram introduzidas. Ao contrário das caixas delimitadoras padrão, as OBBs podem girar para corresponder ao ângulo e à forma do objeto, permitindo um ajuste mais preciso e exato.

Modelos de visão por computador como Ultralytics YOLO11que suportam a deteção de OBB, permitem uma série de aplicações em tempo real, especialmente em cenários em que a orientação dos objectos é importante, como a vigilância aérea. Para além disso, a deteção de OBB é também utilizada nos cuidados de saúde, na agricultura e na análise de documentos.

Neste artigo, vamos explorar o que é a detecção OBB, como ela funciona e onde está sendo aplicada em cenários do mundo real. Vamos começar!

__wf_reserved_inherit
Fig. 1. Exemplo de demonstração da utilização do YOLO11 para a deteção de OBB em barcos.

O que é uma bounding box orientada?

Uma bounding box orientada é um tipo de caixa retangular usada em visão computacional para representar objetos detectados em uma imagem. Enquanto as bounding boxes padrão estão alinhadas com os eixos horizontal e vertical da imagem, as OBBs podem girar para corresponder ao ângulo real do objeto.

Essa capacidade de rotação traz várias vantagens. As OBBs podem se alinhar mais estreitamente com a orientação de um objeto, permitindo que a caixa se ajuste firmemente ao redor da forma e direção do objeto. Como resultado, a detecção se torna mais precisa.

Os OBBs são especialmente úteis quando os objetos não estão perfeitamente retos, como um carro virando em uma estrada curva em filmagens aéreas, um livro inclinado em uma mesa ou um tumor rotacionado em uma varredura médica. Ao corresponder ao ângulo de um objeto com mais precisão, os OBBs melhoram o desempenho da detecção, reduzem a interferência de fundo e são particularmente ótimos para aplicações onde a orientação de um objeto importa tanto quanto sua posição.

__wf_reserved_inherit
Fig 2. Comparando a detecção de objetos e a detecção OBB.

Detecção OBB vs. detecção de objetos

A detecção OBB e a detecção de objetos tradicional podem parecer semelhantes à primeira vista, mas são usadas de maneiras diferentes e para situações diferentes. Vamos dar uma olhada mais de perto em como elas se comparam com um exemplo.

Os modelos de visão por computador, como o YOLO11, podem ser treinados para detect e classify objectos em várias aplicações do mundo real, como a inspeção industrial. Considere uma linha de montagem de fábrica onde diferentes peças de máquinas se movem ao longo de uma correia transportadora. Algumas peças podem estar bem colocadas, mas outras podem estar ligeiramente rodadas, inclinadas ou sobrepostas devido à vibração ou velocidade.

A detecção de objetos tradicional usa caixas retangulares verticais que se alinham com as bordas horizontais e verticais da imagem. Portanto, quando uma peça é girada, a caixa pode não se encaixar corretamente - pode deixar de fora parte do objeto ou incluir muito do fundo. Isso pode tornar as detecções menos precisas e mais difíceis para o sistema identificar a peça com confiança.

Agora, digamos que você esteja usando a detecção OBB. Nesse caso, o modelo pode desenhar uma caixa que gira para corresponder ao ângulo exato de cada peça. Uma engrenagem inclinada ou um componente angulado será firmemente envolvido por uma caixa que se ajusta à sua forma e direção. Isso significa melhor precisão, menos erros e resultados mais confiáveis, especialmente com relação a casos de uso como controle de qualidade automatizado ou classificação robótica.

Modelos populares de detecção OBB

Agora que temos uma melhor compreensão do que é a detecção OBB, vamos dar uma olhada em alguns dos modelos de Visão de IA mais amplamente utilizados que a suportam.

Foram desenvolvidos vários modelos avançados de visão por computador especificamente para a deteção de objectos rodados ou inclinados. Entre eles, os modelos Ultralytics YOLO são particularmente conhecidos pelas suas capacidades fiáveis e eficientes de deteção de OBB.

Versões anteriores como Ultralytics YOLOv5 foram concebidas para a deteção de objectos padrão. As iterações posteriores, como o Ultralytics YOLOv8 e o mais recente YOLO11, introduziram suporte nativo para deteção de OBBs. YOLO11, em particular, oferece precisão de última geração sem comprometer a velocidade, tornando-o uma opção impactante para aplicações em tempo real.

Os modelosYOLO11 OBB pré-treinados, como o obb, são treinados em conjuntos de dados como o DOTAv1, que consiste em imagens aéreas anotadas com uma gama de classes de objectos como aviões, navios e campos de ténis que aparecem em vários ângulos e orientações. 

Além disso, estes modelos estão disponíveis em cinco tamanhos diferentes, desde nano (obb) a extra-grande (obb), para corresponder a diferentes necessidades de desempenho. Esta versatilidade permite-lhes ser aplicados em várias indústrias - desde a monitorização de infra-estruturas urbanas e inspeção de maquinaria até à leitura de texto distorcido em documentos digitalizados.

Treino personalizado YOLO11 para deteção de caixas delimitadoras orientadas

Em muitas situações do mundo real, os objectos que precisa de detect podem ser completamente diferentes dos que constam dos conjuntos de dados de treino padrão. Por exemplo, objectos como ferramentas numa linha de produção, embalagens de produtos ou componentes numa placa de circuitos podem ser rodados, colocados de forma irregular ou ter uma forma diferente. 

Para detect com precisão estes objectos personalizados, especialmente quando a orientação é importante, é importante treinar modelos como o YOLO11 utilizando as suas próprias imagens e etiquetas. Este processo é conhecido como treino personalizado

Aqui está um olhar mais atento ao processo passo-a-passo para treinar YOLO11 para a deteção de OBB:

  • Coleta de imagens: Reúna imagens que mostrem seus objetos-alvo de diferentes ângulos, posições e ambientes do mundo real.
  • Anotação de objeto: Rotule cada objeto usando caixas delimitadoras rotacionadas (OBBs) para capturar sua localização e orientação usando ferramentas de anotação com suporte a OBB.
  • Preparação do conjunto de dados: Organize suas imagens e rótulos na estrutura de diretório YOLO e crie um arquivo de configuração YAML com seus nomes de classe e caminhos de conjunto de dados.
  • Treino do modelo: Escolha uma versão do modelo YOLO11 que se adapte às suas necessidades e execute o processo de formação para que o modelo possa aprender com as suas imagens rotuladas.
  • Avaliação e implantação: Teste seu modelo treinado em novas imagens, avalie sua precisão e implante-o em aplicações práticas como manufatura, vigilância aérea ou análise de documentos.

Aplicações habilitadas pela detecção OBB

Objetos que estão descentralizados ou inclinados são bastante comuns em cenários da vida real. Vamos percorrer alguns exemplos onde a detecção de OBB faz uma diferença real ao detectar com precisão esses objetos.

Análise de imagem de raio-X usando detecção OBB

A detecção OBB pode levar a análise de imagens médicas um passo adiante, melhorando a precisão. As imagens médicas geralmente incluem estruturas anatômicas, como tumores, órgãos ou ossos. Essas estruturas geralmente aparecem em formas irregulares e orientações variadas. Como os OBBs podem girar para corresponder ao ângulo de um objeto, eles fornecem uma localização e medição mais precisas, o que é fundamental para o diagnóstico e o planejamento do tratamento.

Esta abordagem é especialmente eficaz quando se trata de analisar imagens de raios-X de fraturas ósseas, onde a posição e o alinhamento dos ossos são fatores-chave. Por exemplo, a deteção de OBB tem sido usada para analisar raios-X de cotovelo pediátrico. Ao ajustar-se à orientação dos ossos, ajudou a melhorar a precisão da deteção. 

__wf_reserved_inherit
Fig. 3. Raios-X (a, d) com deteção de objetos (b, e) e deteção de caixas delimitadoras orientadas (c, f).

Vigilância aérea impulsionada pela detecção de OBB

A vigilância aérea é uma ferramenta essencial em sectores como a segurança pública, a monitorização ambiental e o planeamento urbano. As imagens captadas por drones ou satélites podem ajudar a identificar objectos como navios, veículos e edifícios. No entanto, nestas imagens, os objectos aparecem frequentemente pequenos e em ângulos invulgares, o que torna mais difícil a sua detect precisa.

A detecção OBB resolve isso inclinando as caixas delimitadoras para corresponder ao ângulo de cada objeto. Isso leva a medições mais precisas do tamanho e orientação de um objeto, apoiando uma melhor tomada de decisão em áreas como planejamento urbano, defesa, resposta a desastres e monitoramento ambiental.

Um exemplo interessante de detecção de OBB é o rastreamento de navios em vigilância marítima. As imagens de satélite frequentemente capturam navios em vários ângulos e tamanhos devido ao clima, iluminação ou movimento. Os OBBs podem se adaptar a essas mudanças, melhorando a detecção, especialmente para embarcações menores ou parcialmente obscurecidas.

__wf_reserved_inherit
Fig 4. Uma visão sobre o uso da detecção OBB para vigilância marítima.

Usando detecção OBB na agricultura

A seleção das culturas após a colheita é um passo crucial para garantir a sua qualidade antes de serem embaladas e enviadas para o mercado. Embora muitos sistemas funcionem bem para frutos redondos como maçãs e laranjas, as culturas longas e estreitas, como cenouras ou rebentos de Zizania, podem ser muito mais difíceis de manusear. As suas formas variam e muitas vezes acabam em ângulos diferentes, tornando-as difíceis de detect e classificar com precisão.

Para resolver este problema, os investigadores desenvolveram um sistema que utiliza a deteção de caixas delimitadoras orientadas (OBB) para identificar e classificar estas culturas com maior precisão. O sistema pode detect várias culturas numa imagem, mesmo que estejam inclinadas ou sobrepostas, e avaliar a sua qualidade e posição em tempo real.

Prós e contras da detecção OBB

Aqui estão alguns dos benefícios de usar a detecção OBB:

  • Entrada aprimorada para tarefas downstream: Tarefas de visão computacional como segmentação de instâncias e rastreamento de objetos podem ter um desempenho melhor quando recebem detecções de objetos mais precisas.

  • Raciocínio espacial aprimorado: Ao capturar o ângulo de orientação, os OBBs possibilitam a compreensão do alinhamento e da direção de um objeto.

  • Redução da sobreposição em cenas lotadas: Os OBBs reduzem a ambiguidade ao ajustar os objetos de forma mais precisa, mesmo em cenas movimentadas ou confusas.

Apesar de ajudar a melhorar a precisão da detecção em cenas complexas, a detecção OBB apresenta algumas limitações a serem consideradas:

  • Maior sensibilidade ao ruído: Pequenos erros na previsão do ângulo podem ter um impacto maior na precisão da detecção, especialmente para objetos compactados ou alongados.
  • Ferramentas especializadas necessárias: Como nem todas as plataformas de rotulagem e treinamento suportam nativamente OBBs, trabalhar com elas pode exigir ferramentas ou configurações adicionais.

  • Disponibilidade limitada de conjuntos de dados: Comparado com a detecção de objetos padrão, atualmente existem menos conjuntos de dados disponíveis publicamente com anotações OBB, o que pode tornar um pouco mais desafiador começar ou comparar resultados.

Principais conclusões

A detecção de caixas delimitadoras orientadas facilita o reconhecimento de objetos que não estão perfeitamente retos ou alinhados para soluções de visão computacional. Ao capturar a posição e a orientação dos objetos, a detecção OBB aumenta a precisão em casos de uso do mundo real, como digitalização de imagens médicas, monitoramento de terras agrícolas ou análise de fotos de satélite.

Com modelos como o YOLO11 a tornar a deteção de OBB mais acessível, está a tornar-se uma escolha prática para muitas indústrias. Quer esteja a lidar com objectos inclinados, sobrepostos ou com formas estranhas, a deteção de OBB acrescenta uma camada extra de precisão que os métodos padrão muitas vezes não conseguem.

Tem curiosidade sobre IA? Explore nosso repositório no GitHub, conecte-se com nossa comunidade e confira nossas opções de licenciamento para dar o pontapé inicial no seu projeto de visão computacional. Saiba mais sobre inovações como IA no varejo e visão computacional na indústria de logística em nossas páginas de soluções.

Vamos construir o futuro
da IA juntos!

Comece sua jornada com o futuro do aprendizado de máquina

Comece gratuitamente